【IPFS专题#001】HTTP+git+BitTorrent=IPFS

一 HTTP+git+BitTorrent = IPFS


1 IPFS 是一个分布式文件系统(类似BitTorrent)

1.1 什么是文件系统

    我们知道,买的电脑要装系统,就要对硬盘进行格式化,如果是windows系统, 我们通常格式化成ntfs系统,那ntfs就是一种文件系统类型,其实硬盘不格式化也能存储数据,为什么要进行格式化呢,可以这么理解,有了文件系统这层代码,我们人就可以通过文件来访问磁盘当中的数据了,我们之所有能看到硬盘c盘、d盘里的文件或者文件夹,正是文件系统的功劳。就像一个仓库,里面的放置的各种木材,如果把这些木材按作用和功能分类,比如,把组合成床的所有加工好的木材归为一类,把组合成沙发的归为一类,那我们用户访问仓库里的东西,就只是床、沙发即可。

1.2 文件系统分类

       按文件系统是否能被多主机访问,分为本地文件系统和网络文件系统,如果是只能被一个主机访问,那这个文件系统就是本地文件系统,如果能被多主机都能访问,就叫做网络文件系统,就像仓库,如果只能被自己用的仓库就是私有仓库(本地文件系统),如果共享出去,能接收各个公司的货物,那就是公共仓库(网络文件系统)

1.3 分布式文件系统:节约带宽、防止DDOS攻击等

    分布式文件系统是网络文件系统一种形式,还以仓库为例,比如现在的物流之所以这么快,就是商家整合了各个地区的仓库(公共仓库),当用户要购买东西时,就从离用户最近的仓库发货 ,也就是说,同类的商品会分布在不到的地区和仓库,极大提高了物流的速度。分布式文件系统也是一样,文件分布在不同的主机(节点)的系统里,当要请求文件时,就向网络中主机广播,有文件的主机就响应请求,如果是大文件,请求的数据可以分布在不同的主机上,这样,既能节约带宽,又能提高速度,还能有效防范DDOS攻击。

2 IPFS是一个版本化的分布式文件系统(类似git)

具有git等分布式版本控制系统的特性:提供上传下载文件等管理功能、能跟踪文件版本的变化且自动删除重复的文件

版本的理解:对同一个文件修改,提交到ipfs后产生的是新的文件,旧的文件还会存在,这样,在ipfs库里就记录了两个版本(旧版和新版),记录了多个版本,自然就方便不同的版本的切换。

通常开发团队人员协作开发,都需要使用一种版本控制软件,比如svn ,git等,git有个最大的好处,不像svn,是c/s架构,s端(服务端)出现问题,那么意味着svn就不能用了,git呢,每个开发者的电脑即是客户端也是服务器,就不存在单点故障的问题(服务器出现故障就不能访问的问题),同时,版本化还有一个好处就是自动去重,比如有两个目录,a和b ,a目录里有文件a1 b目录里也有a1 ,在ipfs只会记录一个a1.

3 IPFS使用内容寻址(代替http的位置标识符寻址URI),完全分布式的网站

我们访问的淘宝、京东等网站,都是集中化的网站,网站背后有无所多的主机放在机房,要借助很多技术(集群技术、cdn技术、缓存加速技术、代理技术等等)并且需要专业的维护工程师进行维护(安全性、稳定性以及性能等),总之,集中化的网站,投入大,成本高,如果换一种模式,把数据分布到不同的中心和节点,划整为0,再加上有效的激励机制,不失为好的方法。

二 基于以上内容,整理出IPFS特性


1 分布式存储

2 基于区块链技术,提供永久性的不可更改的的数据存储

3 不存储重复文件,节省存储空间

4 不存在单点故障

5 有可能取代HTTP

三 IPFS工作原理(下一篇)


下一篇通过实战操作,得出IPFS工作原理

四 IPFS系统基本管理(像ntfs文件一样,拥有创建文件、查看文件目录,访问文件等属性)


场景一:发布网站索引页,并测试

0 准备索引页

使用vi编辑器创建index.html,内容如下图:


1 创建文件

语法:$ipfs add file

要把index.html上传到ipfs,请按下图操作:


每一个文件都生成一个对应的hash 值

2 查看文件

语法:$ipfs cat hash

要查看上传的index.html的内容,应该是如下的命令:


3 查看文件的大小

语法:$ipfs block stat hash


4 访问网站索引页

打开浏览器,输入http://localhost:8080/ipfs/hash值(语法)

我这里使用的是文本浏览器elinks,方法如下:


成功访问

场景二:使用节点id访问网站

1 查看节点id

每个ipfs节点都有一个独一无二的id

语法:$ipfs id

2 默认通过id是无法访问网站的

语法:http://localhost:8080/ipns/id

3 需要把索引文件index.html发布

语法:$ipfs name publish hash


4 再次访问


成功访问

场景三:ipfs是按block存储数据(其实单纯学命令没有意思,结合场景学习命令是不错的方法)

1 准备大一点的数据

下面的命令是创建500M大小的文件mytest


2 上传


3 上传成功


4 查看文件的块分布情况