解决github-pages无法被百度抓取问题(octopress)

原文地址:http://blog.bibitiger.cn/blog/2017/02/23/duel-github-cant-for-baiduspiders/


网上已经有很多关于这个问题的解决方案,例如CDN到七牛等的镜像缓存、修改ip代理、云服务器等等,例如知乎上的问答“如何解决百度爬虫无法爬取搭建在Github上的个人博客的问题?”,在此就不一一复述了。直接说一个方便的解决方案。

我在github-page上放的是个人博客,主要就是国内用用,实在是英文不怎么样。使用octopress搭建,其实就是静态网页。在这个前提下,那如果我们找一个支持静态网站的空间同步github,并且我们的域名支持智能DNS,那问题是不是很好解决。原来的gitcafe现在的coding.net就能很好的解决这个问题,而且他现在还支持jekyll。正好我的域名是用的万网,支持智能DNS。

好了,废话说完,开始干活。

首先注册一个coding.net的账号,老路数了。接着建立一个跟账号用户名同名的仓库,例如
https://git.coding.net/username/username.git

在terminal下打开原有octopress的地址(假定这个地址就是octopress,以后都是用这个地址为根目录),到octopress/_deploy目录下,添加coding.net的远程地址,并且新建分支。

cd octopress/_deploy
git remote add coding https://git.coding.net/username/username.git
git checkout -b coding-pages
git checkout master
git branch
>  coding-pages
>  * master
git push coding master/coding-pages

在coding.net的仓库里设置pages的分支

set_coding_pages

保存了分支之后,打开http://username.coding.me/username就能看到我们的博客了。

接着去万网设置域名解析,将原来的github设置为海外,新加一个CNAME类型的记录为pages.coding.me设为默认。

set_coding_pages

一般十分钟之内生效,生效后回到coding去设置自定义域名,输入刚才解析的二级域名,绑定完成。

告一段落,这个时候你ping自己的域名地址,同步到coding已经完成,会发现和原来的ip不一样了。

但是如果我们每次deploy之后,都要去手动再给coding提交一次,很麻烦,所以索性直接写到rakefile里去。

multitask :push do
  puts "## Deploying branch to Github Pages "
  puts "## Pulling any updates from Github Pages "
  cd "#{deploy_dir}" do 
    Bundler.with_clean_env { system "git pull origin #{deploy_branch}" }
  end
  (Dir["#{deploy_dir}/*"]).each { |f| rm_rf(f) }
  Rake::Task[:copydot].invoke(public_dir, deploy_dir)
  puts "\n## Copying #{public_dir} to #{deploy_dir}"
  cp_r "#{public_dir}/.", deploy_dir
  cd "#{deploy_dir}" do
    system "git checkout #{deploy_branch}"
    system "git add -A"
    message = "Site updated at #{Time.now.utc}"
    puts "\n## Committing: #{message}"
    system "git commit -m \"#{message}\""
    puts "\n## Pushing generated #{deploy_dir} website"
    Bundler.with_clean_env { system "git push origin #{deploy_branch}" }
    puts "\n## Github Pages deploy complete"
    Bundler.with_clean_env { system "git push coding master:coding-pages" }
    puts "\n## coding.net Pages deploy complete"
  end
end

以后运行rake deploy时,就会自动同步到coding里去了。

最后再说说百度抓取的事,本来到这里就应该结束了,但是百度好死不死的反应慢,就跟大家说说吧。在站长工具的抓取诊断测试一下,是否可以抓取成功,如果没有成功的话查看抓取状态下的抓取失败,如果网站IP和没有修改之前的一样,点击后面的报错,隔上大概半个小时再来试下,如果还是这样的话,在右下角的反馈中心反应一下,我是反应了才通过的。。。

百度链接提交的自动方式有三个:主动推送、自动推送、sitemap。
主动推送:我没怎么用,在工程底下建一个txt,将已有想提交的网页地址逐行写入,然后curl一下就好了,但是有条数限制,我是懒得搞这个了,想起来提一下,主要靠自动推送和sitemap。
自动推送:将百度提供的工具代码,放到一个合适的位置就好,然后每次打开网页的时候都会使用百度的push.js。我是放到了octopress/source/_includes/custom/footer.html里,大家可以参考。
sitemap:由于octopress已经require了 jekyll-sitemap,我们只需要保证_config.yml里的url是我们上面解析的二级域名就好,每次generate的时候会自动生成,提交之后在根目录就有一个sitemap.xml,将这个文件的地址提交给百度就好了,百度会不定时的去更新这个文件。

ok,大功告成

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,117评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,963评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 107,897评论 0 240
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,805评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,208评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,535评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,797评论 2 311
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,493评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,215评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,477评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,988评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,325评论 2 252
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,971评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,807评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,544评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,455评论 2 266

推荐阅读更多精彩内容