SEO
SEO蔸雨_分享免费SEO湿货,请相信这里的SEO教程_SEO技术_SEO工具全都是湿的。
自动生成词,并通过tf-idf算法分析不同文本的不同
本程序修改并集成自其它的两个人的源码,功能是:
1、自动从一大段文本中提取可能组成的词语。
2、通过输入多个文档,通过tf-idf算法自动提取各种文档的关键字。
3、通过提取关键字可以得到不同的QQ群讨论的主要内容。
SEO如何处理采集内容(5)
【GOGO闯】:后台留了一堆问题,本篇是对其中两个问题的答疑
正文抽取
在【SEO如何处理采集内容 ①】中的“泛采集”部分提到过正文抽取,然后有一些人依旧表示不知道怎么搞。
这东西用网上开源的就可以,Google搜索“{编程语言}正文提取算法”便能找到一大堆的解决方案,如:Readability、Boilerpipe、Diffbot……大部分算法已经打包好了,拿过来就可以直接用,用不着自己写。我们是做网站的,不是搞技术的,有现成的轮子用就OK了。
SEO如何处理采集内容(4)
两个问题
在准备采集前找词的时候,有个蛋疼的问题:
无论任何一种找词渠道,固定搜索词(如阿拉巴巴招聘)和个性搜索词(如阿里巴巴工程师级别怎么划分)总是杂糅到一块的,对于同一词根下的扩展词,如何将这两类词分开?
固定搜索词往往可以根据固定词缀的出现次数来预估关键词的流量,毕竟同一个词缀出现次数高,流量也会相对高。但个性化搜索词流量和竞争度怎么判断?
为什么非要把两类词找出来呢?因为这两类词的采集源往往是不同的……
SEO如何处理采集内容(3)
【GOGO闯:】有基友留言说“没图你说个屁”,本渣渣想哪里没留图了,一看上篇结尾还真没把图片加上。因为文章我用markdown排版,图片引用七牛的图床,在微信编辑器转成富文本的时候正常显示,一发布的时候就漏掉了,微信公众号的图片不能引用外部链接!
采集内容上线逻辑
有基友问采集的内容怎么分类,抓取的词怎么分类。其实很简单,做个小网站就都明白了,本渣渣在此科普下
采集内容清洗后是要入库的,入库就得有逻辑,所以在采集一开始就得想到这点,并设计采集到上线的流程
SEO如何处理采集内容(2)
【GOGO闯】:上回时间太赶,对采集内容处理写的很浅,在实际操作过程中仍有很多奇淫巧技,需要创意与技术的结合。此文全程装逼。
回顾
上回说道处理采集内容的两个先后步骤:
对原始内容的处理
对处理后内容进行组织
第一块,对原始内容的处理,上篇主要针对html源码信息的处理,但没说对文本信息该如何处理。
下面分享下本渣渣曾经使用的一些,对采集内容文本的处理方式…
SEO如何处理采集内容
【GOGO闯:】这么久才开通留言功能,好丢人,这篇是本渣渣图新鲜试试留言功能用的,没有干货
采集内容对SEO是否有效?
有人说采集内容对搜索引擎友好性不高,不容易获得排名,这个是肯定且必然的。
对大多站点,上采集内容必定不如UGC、精心编辑过的内容来的效果好。但是,现在搜索引擎能获取到的原创内容量已经不如之前多了,毕竟内容生产平台已经转移了,早就不集中在网站上了。另外几个搜索引擎之间还相互抓,何况小站点呢。
所以采集内容依旧是有效的,只不过对采集内容后加工的成本越来越高了。
【张亚楠】2016 SEO趋势分析
前言
回想一下,做SEO已经6,7年了,但仍没忘记被排名和流量支配的恐惧。
伴随着搜索引擎的进步,SEO也一路发展。从之前的无脑外链,海量外推,到现在的移动流量崛起;从以前的医疗泛滥,到互联网广告法的9月1日实施;从之前百度对SEO的无情打击,到工程师Lee跟SEOer的沟通,再到现在的百度站长平台5周年。
变化不可谓不快,真让我有点不学习就会被时代抛弃的感觉。
seo标准化流程
国平曾经曰过:SEOer最易犯的毛病是把过程当结果、把手段当目标、把方向当计划,入行至今已见识过不少SEOer“拍脑门”、“拿来主义”、“生搬硬套”、“排名为王”式的SEO行为。不可否认,现在大多SEO只知道要这么做,却不知道出于何种原因要这么做,而且事实上这么做还是错的。任何行业都可以依据科学合理的逻辑进行标准化的流程,好的流程能够将工作往正确的大方向进行引导,对于严重缺乏标准化的SEO,更是如此。
任何SEO项目都由:问题分析–目标制定–策略选取—方案制定–执行回馈–后期监控,这6个环节组成,因为大部分SEO都处于“执行”阶段,也就是什么都没想就直接开始干,而忽略前3个环节,方向不对执行再好也是反作用,所以主要讲下前3个环节(SEO项目分析)
假设现在BOSS看目前的流量不顺眼,一拍桌子,提出从5月到年底自然搜索流量翻1倍的要求,SEO该怎么做?