今晚补昨天和今天的,这两天检查,没法用笔记本
准备明天组会
《A Method for Real-Time Peer-to-Peer Traffic Classification Based on C4.5》 2010北邮
ML分类结果好坏取决于在a flow 结束后选择的流特征,但是实时网络要求在flow结束前对流进行分类,这就要求对一个flow的分类需要依靠以任意时间点为开始的最近N个packets为依据进行分类。
使用C4.5决策树和滑动窗口,用文中方法准确率不错,而且flow中的前几个packets丢了也不会影响检测的准确率
【1】【2】深度包检测 2004
本文focus on 高效(因为是实时在线检测)
提特征不依赖于完整的flow,跳过flow开头的10~1000个packets
【4】朴素贝叶斯:特征彼此独立且服从高斯分布时分类效果才好 249种特征
【5】K-means 对TCP app进行分类,使用TCP flow的前五个packets‘ size
P2P file sharing 如:Bit torrent ,eMule,Thunder,P2P流媒体(PPLive,PPStream),P2P voice app(Skype)
这些应用在传输层协议上是不同的,TCP/UDP作为第一个特征
包长度分布不同 第二个特征是 main data section 这个没用啊 泛化能力太弱了
第三个特征是控制包的比例 这个也没用
给定一个flow,使用滑动窗口提取属性,这个窗口moves across the flow
总体来讲没啥用
原文:https://www.cnblogs.com/tutu-juejue/p/11594866.html