秘迹搜索,一款不追踪的搜索引擎

今天,我们带来了一个可以保护个人隐私的网络搜索服务——秘迹搜索。秘迹搜索不会记录用户输入的查询关键词,真正做到搜索不留痕,彻底摆脱定向广告的骚扰。

谈到保护隐私,先来看看其他的网络搜索引擎是如何获取用户隐私信息的。因为当前中国大陆提供搜索服务的搜索引擎(还有国外的Google),都在使用相似的方法来获取用户隐私,所以在下文中我们用某某搜索来统一替代所有其他追踪用户的搜索引擎。

日常用户使用某某搜索引擎的过程,可以拆分成如下的几个步骤来理解:

使用浏览器打开某某搜索网站的网址,输入查询关键词。

某某搜索网站返回搜索结果数据的同时,还使用了各种追踪用户的黑科技,包括 tracking scripts, tracking pixels, tracking cookies 等等等等,来尽量精准地追踪用户在互联网上的各种行为。

以后这个用户查询不同的关键词,某某搜索网站会利用追踪技术,不断收集和存储他的搜索甚至浏览行为信息。不断丰富地勾勒出这个用户的兴趣爱好、健康状况、甚至家庭成员等等个人隐私信息。


这些搜索引擎在收集了众多用户画像信息后,最主要的商业变现方式就是定向广告。下图是某搜索引擎广告平台上对其精准人群定向能力的宣传,日均百亿次的线上行为数据中很有可能就包括你的搜索及点击行为。 


而当一个用户使用秘迹搜索的时候: 1. 使用浏览器打开 https://mijisou.com,输入查询关键字。 2. 发起的网络请求传递到秘迹搜索的服务器上。但是秘迹搜索的服务器没有记录用户的任何信息(不光没有记录用户输入的检索词,从用户浏览器中带过来的IP地址、UserAgent、HTTP Header等信息,也统统没有记录)。 3. 最后,秘迹搜索将结果数据返回给用户的浏览器。 秘迹搜索没有存储任何的用户信息,也没有使用任何追踪用户的黑科技(tracking scripts, tracking pixels, tracking tags),甚至连浏览器Cookie都没有使用, 也就自然不会泄漏用户的隐私信息了。


说完了其他搜索和秘迹搜索的区别,我们再来看看很多网民常见的一个疑惑:很多浏览器都带有隐身模式或者无痕模式,在隐身模式下使用某某搜索,用户的隐私信息还会被泄漏吗? 其实这个答案就写在隐身(无痕)模式的的提示中,见下图。浏览器的隐身模式只是不在你的电脑上留下浏览痕迹和历史记录,但是它不会阻拦你访问的网站收集你的个人信息,也就是说只有秘迹搜索才是真正的无痕搜索。


从上面的对比分析中,我们可以清楚地看到对于用户的隐私保护,秘迹搜索并没有用太过神奇的黑科技,只是在严格遵循一条隐私原则:不存储和记录任何可以关联到用户身份的信息。下面我们会重点介绍一下为了严格执行上述隐私原则,秘迹搜索在技术实现上所做的实践和尝试。

没有Cookie的搜索引擎

说起Cookie, 可能对于熟悉技术的朋友都不会陌生。简单的说,cookie就是:网站为了记录用户的状态信息而在用户的浏览器里保存的数据文件。Cookie的发明本是用来优化互联网服务体验的,但是现在越来越多的网站将它用来进行用户身份追踪。对于秘迹搜索服务,如上文所述,我们没有在用户的浏览器里种任何Cookie。这一点只要你打开浏览器的开发者工具就可以看到,见下图。

提供聚合和过滤功能

如果你刚刚已经试用过秘迹搜索,就会发现在目前阶段,秘迹搜索的结果聚合了各种搜索引擎的检索结果。但我们并不是简单的提供聚合结果,秘迹搜索在后台帮助用户过滤掉一切追踪脚本和可以过滤掉的广告信息,最终提供给用户的都是干净的结果信息。我们做过一个实验分析,直接利用桌面浏览器访问某主流搜索引擎,和利用秘迹搜索访问某搜索引擎,在相同返回结果前提下,秘迹搜索的返回结果可以节省近10倍的网络流量,这些节省的流量大多数都是广告和追踪脚本。 所以,虽然我们的大部分搜索结果也是来自大家常用的搜索引擎,但是这些搜索引擎却不会追踪到你,也不会记录下你的IP地址和浏览器等信息。


提供匿名访问功能

除了提供搜索服务外,秘迹搜索对于检索到的结果还提供匿名访问功能,见下图所示。


匿名访问功能本质上是一个代理服务,比如你想访问秘迹搜索结果页中的 www.a.com 网站,如果通过匿名访问来浏览, 我们会通过代理服务(proxy.mijisou.com,这个代理服务是秘迹搜索自己的独立服务,依然不会记录任何请求日志)去获得www.a.com网站上的有用信息,然后再把有用信息中转展示给用户。 这个代理服务会完全保护用户免受各种追踪和搜扰。 但是在目前阶段我们的匿名访问的兼容性还需要完善。对于部分网站,有时候还会出现乱码和服务请求超时等问题。我们的程序员小哥哥正在不断优化这些服务,如果在使用过程中碰到这些问题,敬请谅解或者反馈给我们。


如果不收集用户数据,那我们是如何统计搜索访问量的呢?

每个网站都会统计用户访问量,为了准确的统计出每日用户请求数,在不收集任何用户信息的前提下,我们在search.conf 配置文件中增加了如下命令语句: access_log /var/log/nginx/search_access.log searchformat if=$arg_q (秘迹搜索的请求参数是q, 所以才使用$arg_q这个变量), 用白话翻译就是说只有用户真正使用秘迹搜索发起一次搜索请求时,我们才会根据searchformat 这个日志格式来记录日志。searchformat 的格式 : log_format searchformat '$status $time_local $http_host site="$server_name"(在Nginx.conf文件中配置) ,每条用户请求的真实日志如下所示。

200 23/Oct/2018:21:36:58 +0800 mijisou.com

可以看到秘迹搜索没有记录任何有关用户个人信息的字段, 我们使用上述方法做到了不记录任何用户请求信息的同时,又可以准确统计出秘迹搜索的每日访问量。未来我们也希望可以实时公开搜索服务的日志,甚至能够做到将整个运维操作实时公开,这些后续目标在我们的todo list 中,敬请期待。

互联网和大数据技术带来便捷生活体验的同时,也带来了种种乱象: 精准的用户画像被用来做大数据杀熟、网络上的定向广告比单元楼里粘贴的小广告还要可恶,网民的个人信息在黑市上、在各种互联网广告公司手上交易、贩卖。面对这样的现实,我们希望能够尽一点微薄之力,能够守护一丝网民的隐私信息。如果你也有这样的想法,快来联系我们吧。

PS: 为了保证我们服务的公开透明,目前我们特意选用了一个开源的j解决方案,而且我们基于其上的改进也同步开源出来。这样任何组织或者个人,都可以部署一套这个服务,给你自己或者你的家人、朋友使用。只要你部署的这个服务有足够多人使用,就可以确保自己的搜索关键字无法被跟踪。当然,你的部署如果只有你自己一个人用,就没有意义了。可以说,越多人用的话,搜索行为数据就被保护的越好。道理很简单,大隐隐于市。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,569评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,499评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,271评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,087评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,474评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,670评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,911评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,636评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,397评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,607评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,093评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,418评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,074评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,092评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,865评论 0 196
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,726评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,627评论 2 270

推荐阅读更多精彩内容

  • 搜索引擎优化(Search engine optimization,简称SEO),指为了提升网页在搜索引擎自然搜索...
    翻滚吧海阔天空阅读 3,959评论 5 14
  • 电商行业 创业创业 你不知道的100个隐秘的实用搜索引擎 摘要:尽管Google被大家认为是世界上最优秀的在线搜索...
    2b167bc664a9阅读 5,672评论 3 50
  • 那个吹风机在我手里 像一把枪 我想用来杀死一个自己 这样我好守卫一个自己 那个吹风机在我手里 像风的源 我假装自己...
    僧闻阅读 282评论 0 8
  • =====音乐:你好不好周兴哲 过完春节的第一个工作日,夜晚,噼里啪啦的爆竹声和美丽缤纷的烟花仿佛还在眼前。 有些...
    塔尖公主阅读 576评论 0 1
  • 作用 用来查看程序运行所需的共享库,常用来解决程序因缺少某个库文件而不能运行的一些问题 原理 ldd不是个可执行程...
    杀破魂阅读 2,165评论 0 0