什么tracker服务器,它有什么作用?
来源:学生作业帮 编辑:神马作文网作业帮 分类:综合作业 时间:2024/11/10 17:22:35
什么tracker服务器,它有什么作用?
tracker服务器是BT下载中必须的角色.一个BTclient在下载开始以及下载进行的过程中,要不停的与tracker服务器进行通信,以报告自己的信息,并获取其它下载client的信息.这种通信是通过HTTP协议进行的,又被称为tracker HTTP协议,它的过程是这样的:
client向tracker发一个HTTP的GET请求,并把它自己的信息放在GET的参数中;这个请求的大致意思是:我是xxx(一个唯一的id),我想下载yyy文件,我的ip是aaa,我用的端口是bbb.
tracker对所有下载者的信息进行维护,当它收到一个请求后,首先把对方的信息记录下来(如果已经记录在案,那么就检查是否需要更新),然后将一部分(并非全部,根据设置的参数已经下载者的请求)参与下载同一个文件(一个tracker服务器可能同时维护多个文件的下载)的下载者的信息返回给对方.
Client在收到tracker的响应后,就能获取其它下载者的信息,那么它就可以根据这些信息,与其它下载者建立连接,从它们那里下载文件片断.
关于client和tracker之间通信协议的细节,在“BT协议规范”中已经给出,这里不再重复.下面我们具体分析tracker服务器的实现细节.
从哪里开始?
要建立一个tracker服务器,只要运行bttrack.py程序就行了,它最少需要一个参数,就是–dfile,这个参数指定了保存下载信息的文件.Bttrack.py调用track.py中的track()函数.因此,我们跟踪到track.py中去看track()函数.
Track.py:track()
这个函数首先对命令行的参数进行检查;然后将这些参数保存到config字典中.在BT中所有的工具程序,都有类似的处理方式.
接下来的代码:
r=RawServer(Event(),config['timeout_check_interval'],config['socket_timeout'])
t=Tracker(config,r)
r.bind(config['port'],config['bind'],True)
r.listen_forever(HTTPHandler(t.get,config['min_time_between_log_flushes']))
t.save_dfile()
首先是创建一个RawServer对象,这是一个服务器对象,它将实现一个网络服务器的一些细节封装起来.不仅tracker服务器用到了RawServer,我们以后还可以看到,由于每个client端也需要给其它client提供下载服务,因此也同时是一个服务器,client的实现中,也用到了RawServer,这样,RawServer的代码得到了重用.关于RawServer的详细实现,在后面的小节中进行分析.
接着是创建一个Tracker对象.
然后让RawServer绑定在指定的端口上(通过命令行传递进来).
最后,调用RawServer::listen_forever()函数,使得服务器投入运行.
最后,在服务器因某些原因结束运行以后,调用Tracker::save_dfile()保存下载信息.这样,一旦服务器再次投入运行,可以恢复当前的状态.
其它信息:
1、 BT源码的分布:
把BT的源码展开之后,可以看到有一些python程序,还有一些说明文件等等,此外还有一个BitTorrent目录.这些python程序,实际是一些小工具,比如制作metafile的btmakemetafile.py、运行tracker服务器的bttrack.py、运行BTclient端的btdownloadheadless.py等等.而这些程序中,用到的一些python类的实现,都放在子目录BitTorrent下面.我们的分析工作,通常是从工具程序入手,比如bttrack.py,而随着分析的展开,则重点是看BitTorrenet子目录下的代码.
BT作者BramCohen在谈到如何开发可维护的代码的一篇文章中(http://www.advogato.org/article/258.html),其中提到的一条就是开发一些小工具以简化工作,我想BT的这种源码结构,也正是作者思想的一种体现吧.
2、 我们看到,python和我们以前接触的c/c++不一样的第一个地方就是它的函数在定义的时候,不用指定参数类型.既然这样,那么,在调用函数的时候,你可以传递任意类型的参数进来.例如这样的函数:
deffoo(arg):
printtype(arg)
你可以这样来调用:
a=100
b=“helloworld”
foo(a)
foo(b)
输出结果是:
这是因为,第一次调用foo()的时候,传递的是一个整数类型,而第二次调用的时候,传递的是一个字符串类型.
这种参数具有动态类型的特性,是c/c++等传统的语言是所不具备的.这也是python被称为动态语言的一个原因吧.C++的高级特性模板,虽然也使得参数类型可以动态化,但使用起来,远没有python这么简单方便.
client向tracker发一个HTTP的GET请求,并把它自己的信息放在GET的参数中;这个请求的大致意思是:我是xxx(一个唯一的id),我想下载yyy文件,我的ip是aaa,我用的端口是bbb.
tracker对所有下载者的信息进行维护,当它收到一个请求后,首先把对方的信息记录下来(如果已经记录在案,那么就检查是否需要更新),然后将一部分(并非全部,根据设置的参数已经下载者的请求)参与下载同一个文件(一个tracker服务器可能同时维护多个文件的下载)的下载者的信息返回给对方.
Client在收到tracker的响应后,就能获取其它下载者的信息,那么它就可以根据这些信息,与其它下载者建立连接,从它们那里下载文件片断.
关于client和tracker之间通信协议的细节,在“BT协议规范”中已经给出,这里不再重复.下面我们具体分析tracker服务器的实现细节.
从哪里开始?
要建立一个tracker服务器,只要运行bttrack.py程序就行了,它最少需要一个参数,就是–dfile,这个参数指定了保存下载信息的文件.Bttrack.py调用track.py中的track()函数.因此,我们跟踪到track.py中去看track()函数.
Track.py:track()
这个函数首先对命令行的参数进行检查;然后将这些参数保存到config字典中.在BT中所有的工具程序,都有类似的处理方式.
接下来的代码:
r=RawServer(Event(),config['timeout_check_interval'],config['socket_timeout'])
t=Tracker(config,r)
r.bind(config['port'],config['bind'],True)
r.listen_forever(HTTPHandler(t.get,config['min_time_between_log_flushes']))
t.save_dfile()
首先是创建一个RawServer对象,这是一个服务器对象,它将实现一个网络服务器的一些细节封装起来.不仅tracker服务器用到了RawServer,我们以后还可以看到,由于每个client端也需要给其它client提供下载服务,因此也同时是一个服务器,client的实现中,也用到了RawServer,这样,RawServer的代码得到了重用.关于RawServer的详细实现,在后面的小节中进行分析.
接着是创建一个Tracker对象.
然后让RawServer绑定在指定的端口上(通过命令行传递进来).
最后,调用RawServer::listen_forever()函数,使得服务器投入运行.
最后,在服务器因某些原因结束运行以后,调用Tracker::save_dfile()保存下载信息.这样,一旦服务器再次投入运行,可以恢复当前的状态.
其它信息:
1、 BT源码的分布:
把BT的源码展开之后,可以看到有一些python程序,还有一些说明文件等等,此外还有一个BitTorrent目录.这些python程序,实际是一些小工具,比如制作metafile的btmakemetafile.py、运行tracker服务器的bttrack.py、运行BTclient端的btdownloadheadless.py等等.而这些程序中,用到的一些python类的实现,都放在子目录BitTorrent下面.我们的分析工作,通常是从工具程序入手,比如bttrack.py,而随着分析的展开,则重点是看BitTorrenet子目录下的代码.
BT作者BramCohen在谈到如何开发可维护的代码的一篇文章中(http://www.advogato.org/article/258.html),其中提到的一条就是开发一些小工具以简化工作,我想BT的这种源码结构,也正是作者思想的一种体现吧.
2、 我们看到,python和我们以前接触的c/c++不一样的第一个地方就是它的函数在定义的时候,不用指定参数类型.既然这样,那么,在调用函数的时候,你可以传递任意类型的参数进来.例如这样的函数:
deffoo(arg):
printtype(arg)
你可以这样来调用:
a=100
b=“helloworld”
foo(a)
foo(b)
输出结果是:
这是因为,第一次调用foo()的时候,传递的是一个整数类型,而第二次调用的时候,传递的是一个字符串类型.
这种参数具有动态类型的特性,是c/c++等传统的语言是所不具备的.这也是python被称为动态语言的一个原因吧.C++的高级特性模板,虽然也使得参数类型可以动态化,但使用起来,远没有python这么简单方便.