本文从IPV4协议栈原始套接字的分类入手,详细介绍了链路层和网络层原始套接字的特点及其内核实现细节。并结合原始套接字的实际应用,说明各类型原始套接字的适应范围,以及在实际使用时需要注意的问题。
一、原始套接字概述
链路层原始套接字可以直接用于接收和发送链路层的MAC帧,在发送时需要由调用者自行构造和封装MAC首部。而网络层原始套接字可以直接用于接收和发送IP层的报文数据,在发送时需要自行构造IP报文头(取决是否设置IP_HDRINCL选项)。
1.1链路层原始套接字
链路层原始套接字调用socket()函数创建。第一个参数指定协议族类型为,第二个参数type可以设置为SOCK_RAW或SOCK_DGRAM,第三个参数是协议类型(该参数只对报文接收有意义)。协议类型protocol不同取值的意义具体见表1所示:
socket(PF_PACKET,type,htons(protocol))
a)参数type设置为时,套接字接收和发送的数据都是从MAC首部开始的。在发送时需要由调用者从MAC首部开始构造和封装报文数据。type设置为SOCK_RAW的情况应用是比较多的,因为某些项目会使用到自定义的二层报文类型。
socket(PF_PACKET,SOCK_RAW,htons(protocol))
b)参数type设置为时,套接字接收到的数据报文会将MAC首部去掉。同时在发送时也不需要再手动构造MAC首部,只需要从IP首部(或ARP首部,取决于封装的报文类型)开始构造即可,而MAC首部的填充由内核实现的。若对于MAC首部不关心的场景,可以使用这种类型,这种用法用得比较少。
socket(PF_PACKET,SOCK_DGRAM,htons(protocol))
<p align=”center”>
<p align=”center”>表1protocol不同取值
<p align=”center”>
<table style=”width: 623px;” border=”2″ cellspacing=”0″ cellpadding=”2″>
<tr><td valign=”top” width=”132″>
<p align=”center”>protocol
</td>
<td valign=”top” width=”132″>
<p align=”center”>值
</td>
<td valign=”top” width=”355″>
<p align=”center”>作用
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>ETH_P_ALL
</td>
<td valign=”top” width=”132″>
<p align=”center”>0x0003
</td>
<td valign=”top” width=”355″>
<p align=”center”>报收本机收到的所有二层报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>ETH_P_IP
</td>
<td valign=”top” width=”132″>
<p align=”center”>0x0800
</td>
<td valign=”top” width=”355″>
<p align=”left”>报收本机收到的所有IP报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>ETH_P_ARP
</td>
<td valign=”top” width=”132″>
<p align=”center”>0x0806
</td>
<td valign=”top” width=”355″>
<p align=”left”>报收本机收到的所有ARP报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>ETH_P_RARP
</td>
<td valign=”top” width=”132″>
<p align=”center”>0x8035
</td>
<td valign=”top” width=”355″>
<p align=”left”>报收本机收到的所有RARP报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>自定义协议
</td>
<td valign=”top” width=”132″>
<p align=”center”>比如0x0810
</td>
<td valign=”top” width=”355″>
<p align=”left”>报收本机收到的所有类型为0x0810的二层报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>不指定
</td>
<td valign=”top” width=”132″>
<p align=”center”>0
</td>
<td valign=”top” width=”355″>
<p align=”left”>不能用于接收,只用于发送
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>……
</td>
<td valign=”top” width=”132″>
<p align=”center”>……
</td>
<td valign=”top” width=”355″>
<p align=”left”>……
</td>
</tr>
1.2网络层原始套接字
<p align=”left”>创建面向连接的TCP和创建面向无连接的UDP套接字,在接收和发送时只能操作数据部分,而不能对IP首部或TCP和UDP首部进行操作。如果想要操作IP首部或传输层协议首部,就需要调用如下socket()函数创建网络层原始套接字。第一个参数指定协议族的类型为PF_INET,第二个参数为SOCK_RAW,第三个参数protocol为协议类型(不同取值的意义见表2)。产品线有使用OSPF和RSVP等协议,需要使用这种类型的套接字。
socktet(PF_INET,protocol)
a)接收报文
网络层原始套接字接收到的报文数据是从IP首部开始的,即接收到的数据包含了IP首部,TCP/UDP/ICMP等首部,以及数据部分。
b)发送报文
网络层原始套接字发送的报文数据,在默认情况下是从IP首部之后开始的,即需要由调用者自行构造和封装TCP/UDP等协议首部。
<p align=”center”>
这种套接字也提供了发送时从IP首部开始构造数据的功能,通过setsockopt()给套接字设置上IP_HDRINCL选项,就需要在发送时自行构造IP首部。
<table style=”width: 100%;” cellspacing=”0″ cellpadding=”0″>
<tr><td>
intval=1;
<div align=”center”>
<table style=”width: 623px;” border=”2″ cellspacing=”0″ cellpadding=”2″ align=”center”>
<td valign=”top” width=”132″>
<p align=”center”>protocol
</td>
<td valign=”top” width=”132″>
<p align=”center”>值
</td>
<td valign=”top” width=”355″>
<p align=”center”>作用
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>IPPROTO_TCP
</td>
<td valign=”top” width=”132″>
<p align=”center”>6
</td>
<td valign=”top” width=”355″>
<p align=”center”>报收TCP类型的报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>IPPROTO_UDP
</td>
<td valign=”top” width=”132″>
<p align=”center”>17
</td>
<td valign=”top” width=”355″>
<p align=”left”>报收UDP类型的报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>IPPROTO_ICMP
</td>
<td valign=”top” width=”132″>
<p align=”center”>1
</td>
<td valign=”top” width=”355″>
<p align=”left”>报收ICMP类型的报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>IPPROTO_IGMP
</td>
<td valign=”top” width=”132″>
<p align=”center”>2
</td>
<td valign=”top” width=”355″>
<p align=”left”>报收IGMP类型的报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>IPPROTO_RAW
</td>
<td valign=”top” width=”132″>
<p align=”center”>255
</td>
<td valign=”top” width=”355″>
<p align=”left”>不能用于接收,只用于发送(需要构造IP首部)
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>OSPF
</td>
<td valign=”top” width=”132″>
<p align=”center”>89
</td>
<td valign=”top” width=”355″>
<p align=”left”>接收协议号为89的报文
</td>
</tr>
<tr>
<td valign=”top” width=”132″>
<p align=”center”>……
</td>
<td valign=”top” width=”132″>
<p align=”center”>……
</td>
<td valign=”top” width=”355″>
<p align=”left”>……
</td>
</tr>
二、原始套接字实现
本节主要首先介绍链路层和网络层原始套接字报文的收发总体流程,再分别对两类套接字的创建、接收、发送等具体实现细节进行介绍。
2.1原始套接字报文收发流程
<p align=”center”>
<p align=”center”>图1原始套接字收发流程
<p align=”center”>