谢海永:P2P产业可持续发展之路——P4P
周晓静整理| 流媒体网| 2008-10-06

    【流媒体网】10月6日消息:由流媒体网主办的“P4P、 P2P、BT互联网视频产业研讨会”于9月25日下午在北京举行。本期研讨会的关键词有P2P、P4P、BT、网络电视、网络宽频、视频分享、终端、业务、标准、产品化等,运营商、P2P厂商以及业内专家等40余人参加了本次沙龙。

    美国P4P网络体系结构和算法的创始人,美国耶鲁大学计算机科学系谢海永博士来和我们分享国外P4P标准的历程,以及介绍国外P4P的发展现状,他的演讲引来现场的热烈讨论,以下是录音整理:

    非常高兴有这个机会跟大家探讨P2P产业发展的问题以及向大家介绍在美国进行的P4P的研究工作。
    今天大体的提纲是这样:我首先会大概描述一下P2P的起源、它所遇到的问题以及我们想要寻找的解决方案和它具备的特点,然后我会详细介绍一下我们的P4P方案的具体的特点以及一些细节问题,最后我会介绍一下在美国成立的P4P Working Group的工作以及成员情况。

    P2P起源及遇到的问题

 


 
    这个图大家见过很多次了,总的来说,现在P2P在internet的流量越来越占主导位置了,根据许多不同公司的统计,P2P造成的流量为60%~70%或者更高,在不同地区、不同网络可能稍有不同。占用了大量带宽带来的问题是网络资源使用了,ISP收不上来钱。
    运营商和P2P厂商为了带宽想了很多方法进行斗争,运营商采取措施控制流量,P2P厂商则想方设法绕过这些措施。这是这几年的情况。在美国还有个特殊情况,美国政府一直在推行Network Neutrality这个概念,就是不允许运营商对某些特殊应用、对流量进行限制。美国FCC的想法很简单,就是运营商运营的网络应该是类似高速公路的基础设施,这个基础设施对公众是开放的,不应该出现限定流量或者不同收费的情况。
    我们认为目前的主要问题是两方——作为资源拥有者的运营商和作为资源使用者的终端用户也好、P2P运营商也好、普通网站也好,目前网络没有提供这样一种反馈。我们看历史可以发现,目前的网络主要有两种反馈,一种是路由,另一种是TCP的反馈,比如丢包或者网络发生拥塞、延迟增加。应用程序可以通过这些隐式的反馈获得当前网络状态,然后做自身的调整。这对P2P而言是效率非常低的反馈方式,因为P2P有很多独特个性。
    我们希望结合P2P的特点来找到一种能够解决运营商的问题,同事能够保障P2P应用的解决方案,我们的出发点其实就是疏导,之前运营商用主要采取堙堵方式,加各种各样设备来管理流量。我们认为这是一种双输的方法。

    新解决方案需要具备的特征

 

谢海永博士(周晓静摄)

    我们要找到的解决方案需要具备哪些特征呢?
    首先:我们希望这个方案能解决网络效率问题,也就是能够改进运营商网络使用效率,并且即使不能提高也要保障P2P的应用性能,给终端用户以良好体验。
    其次:我们希望这个方案extensible,现在的P2P应用这么多,各自有各自的特点,而且将来还可能出现更新更好的P2P应用,所以希望这个解决方案能够非常容易的被现有P2P软件以及将来可能出现的P2P软件所使用。
    第三:因为P2P应用涉及的地域和用户量非常大,这个解决方案必须Scalable,它必须能够支持大量上载和下载,同时也要能支持网络提供给P2P应用软件或应用层的反馈。
    我们希望能够找到一种可持续发展方案,首先使运营商和P2P都能获利,其次在整个Internet网应用体系当中运营商和P2P应用软件厂商具有同等或者近似同等的话语权利,网络不能被其中一方主宰。


    嘉宾:我提个不同观点,目前关键问题是运营商喜欢把P2P和它的经济性运营完全对立来看,实际上这个看法是错误的。其实P2P是使得网络最有效被充分利用的技术,对比下IPTV,对比下P2P,我们可以发现,P2P本质是使既有设备能够被最大限度使用的一项技术,它是带来经济效益的。
    运营商需要扪心自问的是,现在的互联网是否已经离开了传统的文字、图片乃至音频为主的时代进入视频时代,如果决定进入视频世纪,带宽就需要进行几倍几十倍的扩充,这个不以你用不用P2P为出发点。P2P相反是提供现有带宽应对这种情况的可能性,如果没有P2P,现在互联网上这么多视频是不可能承载的。
    我们现在遇到的带宽不足的运营经济性成长问题,实际上不是来自P2P,是来自用户,是来自Video应用的广泛普及。

[NextPage]
    我完全同意你的观点,但是这个说法很难说服运营商。实际上你刚才提出的是效率问题,我们要解决的就是一个效率问题,不是站在谁的角度替谁说话,就是要找到一种中立的方案,能够让双方坐下来提高共同的效率。同时这个方案必须允许竞争、防止垄断。
    第四个特征:保密。运营商可能不希望发布他的一些私有信息,P2P厂商也不希望自己的一些私有信息被运营商获取。
    最后:标准化。标准化只是一种手段,实际上是把前面所说的这些特征集中起来了。

    P4P简介及优势

    P4P的全称是Proactive Provider Participation in P2P,希望通过这个方案使ISP和P2P之间形成合作伙伴关系。
    P4P的主要特点是把以前从网络到应用层的反馈?化,刚好P4P这个词和“Pay for Performance”是一样的,之前我们并没有想“Pay for Performance”的意思,但也许将来它也会被纳入到我们这个体系当中来。
    P4P总的目标是要达到一个双赢局面,既能改善P2P用户体验,提高P2P应用性能,又能让运营商能够管理他的网络资源,能够更公平的使用它的网络资源。

 


 
    这是一个大概比较,一种是用CDN方式做媒体分发,一种使用P2P,另外一种使用P4P。P4P通过让网络提供一定的有效反馈从而帮助P2P行程某种结构,能够更有效的使用网络资源。

 
 
    P4P大致结构


    这是一个概念图,我们可以认为有两个运营商,你认为是服务器也好、硬件设备也好、sever也好,运营商把它的一些策略信息发布到P4P SAP里,P4P SAP有一个公用的接口,这个接口在图中用红色虚线表示,P2P可以通过这个接口获取运营商信息。这里我要强调的是这些信息并不是运营商原始发布的信息,而是P4P SAP处理之后的信息,已经做到了Proactive Provider Participation。P2P可以依据这些信息来调整它的网络资源使用效率。
    下面我们先来看一下P4P对运营商性能的改进在哪里:

 


 
    这是在美国做的一个现网测试,这个测试使用的是Verizon的客户以及一些私有信息,使用Pando的客户端程序,这里要比较的使用P4P反馈网络和不使用P4P反馈网络从外部流入网络的流量降低、从外部流出网络的流量降低两个数据的差异。结果显示,从外部流入Verizon网络的流量降低73%,从Verizon流出网络的流量降低54%。


    嘉宾1:我感觉P4P和P2P最大的不同是P2P它是一种无序状态,而P4P采取了一个就近原则。
    嘉宾2:P2P也有就近原则。
    谢:问题是运营商的网络非常复杂,就近原则不能解决所有问题。举个简单例子,比如有三个运营商ABC,三者都有线路连接,也许到B的线路比较昂贵,带宽也比较小,而到C的线路比较便宜,带宽也比较大,而这些信息是P2P很难得到的,运营商拥有这些信息,如果运营商能以某种方式把这些信息反馈给P2P,P2P就可以更好的使用网络资源。
    嘉宾3:这个大家站的角度不一样,这个对P2P厂商可能无所谓,对运营商来讲他就会觉得自己受到损失,他的昂贵线路被占用了。
    嘉宾4:我比较关心的是对用户体验的改善。

 

 


 
    我想大家更关心用户体验,那我们就跳过运营商部分,直接看对Pando的客户端用户体验的提升。对所有用户P4P提高P2P文件下载速度达40%,而对光纤等宽带用户P4P提高P2P文件下载速度达300-500%。
    总的来说,P4P带来的性能改进体现在两方面,一方面运营商网络资源使用效率提高,另一方面终端用户的使用体验得到保证。
    P4P Working Group
    2006年6月到12月我提出P4P概念并做一些实验,P4P Working Group是2007年7月成立的,2008年1~4月做了第一次现网测试,4~6月做了第二次现网测试,第二次测试结果还没有发布,但比第一次更好。
    因为工作组成员越来越多,我们又分成多个子工作组。
    我们接下来会继续做大规模测试,下一步会将流媒体P2P加入进来,并且会做一些ITEF的标准化工作。

[NextPage]
    讨论:
    嘉宾:是否使用P2P缓存?
    谢:开始设立时我们并未考虑使用缓存设备,但是随着研究深入,我们发现使用缓存设备是个非常好的想法。在新的P4P协议里我们增加了使用缓存设备的接口,希望运营商能够有效使用设备。
    嘉宾:测试的网络规模有多大?
    谢:Verizon的网络在北美不是第一大也是第二大,我们测试的是其整个网络。
    当然,用Verizon的网络做测试有一定问题,但是我们主要面对的是向上付费的运营商。
    嘉宾:你的产品最后表现为什么,是在运营商端的路由上加东西,还是在运营商端提供开放接口,还是要求P2P软件厂商去使用你的接口?
    谢:这个问题我暂时回答不了,我主要是从提高网络使用效率出发的。
    嘉宾:以我的理解,P4P的核心出发点是重新定向,合理选择P2P路径,所有工作的核心点是优化。理论上可以用一个很简单的策略把这个问题解决掉,即可以限制P2P的网内定向,理论上讲效果可能还会更好。
    谢:你的所有出发点是基于P2P应用自己来做这件事,但我刚才举过一个例子,从运营商角度来看,很多信息P2P是没办法拿到的,即使你尽了百分之百努力,他可能仍然很不满意,他仍会有很多理由来堵你、限制你。
    嘉宾:那么我们在讨论的是运营商配合型的应用,运营商配合你,P4P的应用才有意义。要配合我们就讲他配合的方法,一个很简单的方法,我可以限制你在区内玩,这样结构会比P4P更简单,所实现的IN和OUT的流量差会更大。
    谢:谁来布置缓存设备呢?
    嘉宾:缓存设备通过应用的方法来走了,谁提供应用、谁从当中获利,谁提供缓存设备。
    谢:那还是P2P完全靠自己的能力试图解决问题的方式。我们的出发点是希望运营商能够提供一些有效信息,然后厂商有选择做不做的权利。
    嘉宾1:这倒是一个合理的想法。这样的话必须设立一个标准。
    嘉宾2:所以他就要抓住那些主流运营商,从这个角度切入更加容易,因为单纯从P2P厂商角度出发,因为牵涉不同利益,反而不好入手。
    嘉宾1:这就很清楚了,就是建一套接口,归根究底就是一个数据结构,列一个IP池,规定哪个IP池是优先的,哪个IP池是滞后的,核心工作就是这个。
    谢:我们就是想提供一个运营商和P2P能够合作的方式。
    嘉宾1:这就出来另一个问题,因为P2P非常频繁,这就意味着你要对它进行路由选择,路由选择过程中可能导致你的效率出现瓶颈。另外你准备提供多少次认证能力?
    谢:目前还在控制层面,我们目前的做法是限制访问频率,真到网络里还有很多工作要做。
    嘉宾:绝对流量是多大?
    谢:考虑绝对流量没有太大意义,主要问题在于我们只使用了一个特殊的P2P应用,这个P2P应用产生的总流量是有上限的,我们只是考虑这个P2P应用对整个Verizon产生的影响,而不是所有P2P应用对Verizon的影响。
    嘉宾:终端用户量有多大?
    谢:大概几十万的样子。参加的用户前后有125万。
    嘉宾:实用化的话,并发数一上来,还是有问题。
    谢:对,实用的话,还是有许多问题要解决。
    嘉宾:跟Pando如何对接?
    谢:Pando提供的是客户端公网地址,我们不需要见到每个私网内有多少个客户端,当然,这个方案也很容易把私网地址考虑进来,取个IP地址对就可以。
    嘉宾:按我的理解,理论上讲这件事情跟客户端没太大关系,归根结蒂要处理的是P2P软件的tracker,就是tracker获得运营商信息,由tracker在自己内部进行路径选择。真正的困难是发生在tracker和P4P info,对前端没有影响。这件事情虽然听起来很烦,但实际初期只有一件事情,运营商只要告诉我们哪些是他的网内定制,哪些不是。
    谢:还不够,单纯重现这个实验,需要你说得这些就够了,但我们需要运营商提供更多的信息。(主要参与讨论嘉宾:瞿海滨、侯自强)(周晓静整理)

    注:文章根据现场录音编辑整理。

    更多沙龙内容请关注我们的相关专题:http://meeting.lmtw.com/080925.htm

责任编辑:lmtwadmin

分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!