一 , 注册域名,尽量选择大平台,方便转移,经常有活动做,批量续费与注册可能会便宜一些
技巧:一般单个注册与批量注册价格不一样,可以随意搞个记事本 随机输入100行随机比较长为20以上的字符
串然后依次在下面批量提交查看批量注册的价格
精品站选择com与cn,普通站或者垃圾站用cn,灰色站用com
百度官方建议域名选择com与cn与net,net一般续费比较贵,活动少,建议排除,其他后缀的米基本不考虑
————————-
1.1,阿里云平台
单个注册地址
https://wanwang.aliyun.com/domain/
批量注册地址
https://check.aliyun.com/domain/bulk-search/basic.htm
1.2,西部数码平台
单个注册地址
https://www.west.cn/services/domain/
批量注册地址
https://www.west.cn/domains/
1.3,新网平台
单个注册地址
http://www.xinnet.com/domain/domain.html
批量注册地址
http://www.xinnet.com/domain/domain_batch_check_new.jsp
1.4,狗爹平台
单个注册地址
https://sg.godaddy.com/zh/offers/domains/godaddy-nb
批量注册地址
https://sg.godaddy.com/zh/domains/bulk-domain-search.aspx
1.5,爱名平台
批量注册地址
https://www.22.cn/ym/
1.6,时代互联平台
批量注册地址
https://www.now.cn/domain/mcheck.php
1.7,易名平台
批量注册地址
https://www.ename.net/domain
————————————————————————-
二,购买vps与服务器的平台
2.1,一般精品站在大陆阿里云,适合单个站,需要备案,灰色行业选择香港也容易被干预,
阿里云注册域名做灰色也容易被封,阿里云地址如下
https://www.aliyun.com/
2.2,一般普通站群使用香港的,速度快,不用备案,cn域名也可以解析到香港,适合大批量做普通站的用户
香港不适合做灰色,因为香港宽带不够大,很多服务商也不希望把攻击引导香港来,所以大多会干预做灰色站
的用户,价格一般选择35到80之间的,可以放50到100个dedecms或者帝国cms生成的html静态站
3.3,选择vps尽量选择ssd硬盘的,60G以上,按月续费的,不要贪便宜选择那些年付的,按月付灵活,有问题
可以立马转移走,最多也就亏一个月,不会因为买了一年的就会被绑死在哪里,没有一家服务商会一直稳定的
世界上最牛逼的阿里云,一年中也会有大概5到7天无法使用的情况,偶尔出问题问题不大,售后不好的服务商,
尽早做好转移阵地的准备,数据每周备份一次是必须要做的事情
3.4,普通香港站的购买地址如下,普通站不需要多ip,不需要高防,参考虚拟空间商一个共享ip挂几万个站都没事。
https://www.etuan.com/keyword/香港vps/price/asc
打开后价格在80元以内的都可以打开看看,比如有双核2G内存的80G以上的ssd硬盘可以用记事本记录下来,
所有看完后,综合考虑一下,选择性价比比较高的试试水,按月搞,vps潜规则就是这样子的,没办法,按年
费容易出事
3.5,灰色行业一般竞争比较激烈,各种灰色手段栽赃攻击举报被墙,所以最终大多选择美国的多ip高防服务器,
地址如下
https://www.etuan.com/keyword/美国/price/asc
————————————————————
三,域名是否有问题,好比有病毒提示,可能被墙,可以参考如下
1,被墙封检测:
http://www.miitbeian.gov.cn/publish/query/indexFirst.action
黑名单中查询,如果有记录则一定是被封了
2,注册好了无法访问,则进行全球检测:http://ping.chinaz.com
,没注册没解析,可以跳过这一步
查询如果显示海外90%以上可以访问,国内90%以上的不能访问,国内大部分地区被封这个域名也残废了
3,360拦截检测:http://webscan.360.cn
提示有敏感恶意虚假欺诈等信息就会被拦截,客户端有360浏览器的小白就无法打开,会少了20%左右的市
场份额
4,QQ管家拦截测:http://guanjia.qq.com/online_server/webindex.html
提示有敏感恶意虚假欺诈等信息就会被拦截,客户端有qq的小白提示风险,qq浏览器无法打开或者手机微信
中也无法打开
也可以直接把这些域名通过你的这个qq发给自己其它qq号,看看域名是否有爆红,爆红了自然会有一些问题的
5,百度搜索该域名 搜索格式如: www.abc.com 提示欺诈等等信息
或者有过灰色bc,大量二级泛站域名之类的记忆遗迹,则要慎重考虑是否值得注册了
6,网站不收录可以加入到百度站长工具中观察几天,看看百度有什么提示警告之类的,也可以在这个地址中检测
一下,看看百度 是否有警告提示http://ce.baidu.com/index/guance
7,最简单就是将你选出来的域名给你的qq小号发一下,如果qq有提示危险或者红色,基本可以放弃了
——————————————————————–
四,长尾词指数以百度为准,其他平台,chinaz与aizhan等大多也是从百度采集的,可能有采集错误或者缓存等
百度指数地址
https://index.baidu.com/
—————————————————————————
五,选词查大概情况,比如查询同行一级域名的数量,与巨头数量,收录数量,尽量是这个数值越小
但是指数越大越好
查询地址如下
http://tool.chinaz.com/kwevaluate?kw=
打开后随便输入一个常见的关键词,再按照下面的说法一个一个看
5.1,一般在业界精品站是不需要查询的,该做什么就做什么,已经固定好了指定词,所以分析意义不大
5.2,灰色站是有指数的词几乎都有同行做,没有指数的词 也可能有人做,所以这个分析意义不大
5.3,这个分析,主要是用于做普通行业的词,而且不固定某个词,任何符合标准的词都可以做
5.3.1,参考值有如下,百度指数中查到指数最好大于2000,指数太小可能是刷的,大指数词不容易刷,
被骗的几率小,除非自己非常喜好这个词,底线起码也要指数500吧。
5.3.2,同行(首页网站前50名)最好小于等于3,大于等于3,可能后面还有30到300个站没有挤进来,
最好是没有同行的词,同行是0,同行是指百度中搜索这个词,出现的前50名中一级域名的地址有多少个,
一级域名出现在搜索结果中,说明人家网站标题可能是这个搜索的词或者包含这个词才会出现在结果中,
这就是同行了,至少同行在做这个词,那么就会有竞争,所以要同行越少越好,同行会做优化,你也会优化,
那么难度就会增大
5.3.3,巨头尽量少,巨头是指搜索这个词,出现内页地址权重大于等于4的网站数量,越少越少,最好是8个以内
如果指数足够大,好比指数过万了或者更高,则可以不用考虑首页巨头数量了,考虑做第2页第3页也可以,最重
要还是同行要少,内页靠前的你可以用一级域名跟他竞争,一般按照以往经验,低权重的一级域名站排名一样有
很多可以超过内页排名在前面的巨头站,好比内页地址的域名有权重5,6,7,你的一级域名时间足够长,一般都可
以超过他们,即使是权重1或者2也可以超过他们,一般按照互联网发展历史,你的一级域名网站标题没有修改过
在百度中多呆一天积累的评级分数是别人内页地址的5倍速度,所以一个霸占首页5年的内页高权重地址,你可能
新域名只需要一年多一点时间就可能把它顶下来。所以网站标题很重要,要包含你做的那个词,网站标题不要乱
叫最好单刀直入,做什么词,网站标题就是什么,不要堆砌超过3次的,要想重复,2个就可以了,最好就一个词,
这样可以让百度精准识别,用户搜索着词,百度直接定位你这个站。也不需要让百度为难你是做啥的了
5.3.4,收录量,收录量越少越好,尽量低于100万,太多了,说明被各大门户关注度高,如果没有一级域名参与,
可能该词已经被百度人工和谐,只让各大新闻门户或者百科,或者百家号等百度人工审核过的数据展现,比如那
些政治大人物,敏感的医疗事件,金融事件,让百度吃过苦头的词,搜索量大,巨头基本是门户的,没有同行的,
建议不要去碰。
5.3.5,关键词挖掘工具很多,
https://ci.aizhan.com/
https://baike.baidu.com/
http://top.baidu.com/
http://top.sogou.com/hot/shishi_1.html
https://trends.so.com/rank
现阶段长尾词挖掘工具基本大多失效,因为大家都是聪明人,能挖出有价值的词基本大多被挖的一干二净了
所以换方法挖词,通过百度百科找长尾词,长尾词不一定包含主词的任何一个字符,只要相关就可以了
比如,”我不是药神” 这个词 在百科中搜索,可以搜索到 “周一围” 这个演员,这个词现阶段还是一个不
错的词,同行为0,指数高峰时达到20多万,现阶段也有1万多。您不一定要做这个词,只是一个选词的方法
而已,掌握了方法,其他大指数词中百科中可以找到比较重要的词
—————————————————
六,百度关于js的说法地址,新站尽量不要加,容易被误判
https://ziyuan.baidu.com/college/articleinfo?id=1091
重点在于这个:为了优先保证大部门网站的收录效果,尽量不要用JS,不要用JS,不要用JS
js最好等网站大量收录取得了百度的一定信任后再去加
不管百度找什么借口说原因,新站尽量不碰js就行,一切按照百度的建议去做站群,避免大规模出事
个别站挑衅一下百度问题不大,大规模的话,主要是为了群体的安全,所以尽量按照百度的说法去做
包含百度的统计js代码,百度推送的js,魔板的js文件,魔板中脚本代码,尽量全部删除,
如果你做的站不考虑百度,可以不用参考这些,毕竟每个搜索引擎都有自己的一套算法。
还有一些比较弱智的想法,说搞成加密的js,让百度识别不出来就没事,不信就可以试试,那样会死的
会更惨,百度js识别出来了没问题自然没问题,就是怕误判与识别不出来,加密的代码是心虚,没有问题加
密干啥,那不是直接验证了你作弊的可能性很高么,一般高跳转作弊的才会去加密。要搞js跳转也要等百度收
录后或者有流量后再去搞,即使百度要k站,也不可能马上反应过来你作弊了,至少再被百度检测出来之前可
以赚一波吧。所以不用一开始就搞js,在百度中作弊的大概有99%都是通过js实现的,所以百度对js看得很重。
尤其是搞淘宝客的js,跳转js,作弊js,当然有一些高手可以躲避百度追踪,但是毕竟少,新手不建议一开始就
想着怎么躲避百度js追踪去思考这个问题,先把网站做起来,收录后再去考虑哪些作弊的事情,其他群文当也
有如何设置广告做物理隔离的方法,什么时候失去作用暂时不清楚
————————————————————
七,网站最好做pc站与手机站一起做,并且分开域名做
参考地址
https://ziyuan.baidu.com/college/courseinfo?id=1689&page=2
7.1,移动站的域名需与PC站域名分开,移动站不建议与PC站公用一个域名;比如PC网站域名建议是www.test.com,对应移动站的域名是m.test.com
7.2,建议使用比较常见的域名后缀,如.com\.cn\.net等;
7.3,不建议网站开设过多的子域名。如果要做多级域名,建议高频率更新
7.4,魔板尽量不要每天都换,半个月到一个月换一次也是可行的
7.5,网站结构采用三级结构,首页根目录,栏目二级,文章三级,文章地址与栏目列表地址可以在同一个文件夹
百度喜欢短地址,结构清晰
7.6,百度喜欢打开速度快的网站,如果做个别精品站,机器扛得住,一般选择discuz或者wordpess之类的程序
如果做站群,尽量不要使用动态或者伪静态的程序,网站多,尽量避免蜘蛛来的时候抓取动态地址,这样可以避
免数据库连接频繁导致网站全部一起卡,所以选择能生成html的站就行。
7.7, 不建议网站进行泛解析,若网站爆发大规模泛解析,且影响恶劣,则会受到搜索策略打压;
https://ziyuan.baidu.com/college/courseinfo?id=1689&page=3
7.8,网站更新频率:经常更新高价值的站点,优先抓取;最好每天更新5次以上的站,每次更新可以是1篇,也可
以是100篇,随意。
7.9, Sitemap:网站可定期将网站链接放到Sitemap中,然后将Sitemap提交给百度。百度会周期性的抓取检查提交的Sitemap,对其中的链接进行处理,但抓取速度慢于主动推送;
7.10,如果不是准备去当敢死队,新站不建议去碰友链,以及各种链轮外链输出,别人的站链接没问题。
7.11,网页内容尽可能加上产出时间,严格说是内容发布时间;且时间尽量全,时间格式为年-月-日 时:分:秒;
7.12,如果是采集站,尽量加上采集的地址,与外链类似,建议站长善于使用nofollow标签,既对搜索引擎友好,又可避免因垃圾link影响到站点本身的权重。转载文章明确注明“来源:xxxx(转载来源站点名)”之类字样,不建议使用“admin”、“webmaster”、“佚名”等模糊的说法。
7.13,如果是原创文章或者站群软件生成的句料库数据与站群生成原创数据,建议加上“本站原创”之类字样
————————————————————————
八,飓风算法打击纯采集站
https://ziyuan.baidu.com/college/articleinfo?id=1660
飓风算法会例行产出惩罚数据,同时会根据情况随时调整迭代,体现了百度搜索对恶劣采集的零容忍。
意思是指,纯采集站基本以后越来越没前途了。网站中至少要有一定比例的原创数据,或者百度上面没有的数据
一篇文章中,大量句子跟互联网上另一篇文章重复,基本可以判断为采集站或者伪原创的采集站了,目前来说伪
原创对百度来说没啥忽悠能力,不管是关键词替换还是插入一部分其他字符,或者删除一部分字符,很难改变这
篇文章50%以上的内容,还是近似于伪原创,伪原创的意思是假原创,一样会被当做采集和谐掉。
如果避免这些问题,可以参考灰色行业的做法,使用站群生成的句料库数据或者原创库数据忽悠百度。
———————————————————————————
九,抓取诊断,百度后台地址
9.1,网站建立好了后,数据灌满了一万后,从站群中挑选几个站加到百度后台,网站添加到百度后台地址
https://ziyuan.baidu.com/site/siteadd
9.2,添加好了网站域名后,打开如下网站抓取诊断地址
https://ziyuan.baidu.com/crawltools/index
把网站首页地址,列表地址随意找一个,文章地址随意找一个等3个地址做代表提交抓取
(首页域名后面要带上/,网站vps中的iis或者其他工具中药设置好默认访问页
面为第一个index.html)
抓取有任何异常提示,好比跳转,dns异常 等等都要想办法处理,或者按照提示处理
如果提示抓取成功,点击抓取成功,查看源码是否含有不认识的js与不认识的友链,如果有想办法删除或
者群内问话
9.3,这个网站抓取是很重要的,建议每周抓取诊断一次,避免网站被黑而不知道,被黑后进行数据还原,也
不需要去找什么问题
————————————————————————————————-
十,句料库行业数据分类
在添加网站到百度后台选择属性的时候,会看到一些行业分类,百度也基本是按照这几种行业分类进行处理
下面做了一些整理,句料库就按照下面几个行业去分,不用折腾其他无关的东西,注意百度添加网站属性行
业分类时建议只选择一个行业,这样让百度更精准识别定位
影视动漫 生活服务 工具服务 教育培训 游戏 书籍 文档 信息技术 网络购物 医疗 新闻资讯 生活和情感 金融
社交网络 机动车 生产制造 政策法规 历史军事 母婴招商联盟 旅游 民生 体育运动
按照自己的需求分好类了,就可以到下面按照自己的情况去打开对应行业,差不多就行,反正是胡编乱造,每个行业采集1万到5万数据,分2到10个句料库文件就可以了,网站按照自己的情况去分行业归属,把不同的词分在不同的行业中归为一类,然后句料库通用就可以了
http://top.chinaz.com/hangyemap.html
——————————————————————————————————-
十一,补充篇,句料库与采集混合的使用(如果你会用原创库,可以用原创库与采集混合使用)
11.1,建议垃圾站先用句料库灌满一万,然后平时维护时使用每个栏目每次通过关键词采集1到5,句料库生成10
设置挂机时数据库有数据直接发布不做采集,发布里面设置每个栏目设置1到5,发布文章顺序随机,这样可以做
到不全是采集,也不全是句料库
11.2,使用句料库灌满数据的时候建议找客服索取没有栏目静态化生成的接口,只做发布,好比设置每个栏目
每次生成句料库50篇,采集都设置为0到0,发布设置全部发布。
11.3,灌满一万后,更换接口,该接口只有登录与一键生成整站的功能,全部执行完毕之后,更换正常的平时
维护接口,该接口特征是每次栏目生成只做30秒到60秒的栏目生成后就进行下个栏目生成,不用每次整个栏目
全部生成,那样会浪费非常多的时间,影响所有网站整体更新速度,每次每个栏目发几篇,30或者60秒足够生
成很多页栏目列表了,百度下次大更细自然会抓取到,平时使用vip群的sitemap接口也行,百度蜘蛛也会
从sitemap中抓取整站数据,所以不一定需要把所有列表每次重新生成一次,还有个好处是避免同行从列表中
采集你的站所有数据,因为列表没有全部生成,所以采集只有部分数据。
—————————————————————————————————————
十二,补充篇,dedecms的文章目录初始更改
怎么做dede的安装数据库呀 比如默认目录不想要{typedir}/{Y}/{M}{D}/{aid}.html
{typedir}/{Y}/{M}{D}/{aid}.html
修改
{typedir}/{aid}.html
通过以下方法修改dedecms默认的文章命名规则
打开/include/common.inc.php
查找:$cfg_df_namerule = ‘{typedir}/{Y}/{M}{D}/{aid}’.$cfg_df_ext;
修改为你想要的文章命名规则,比如跟版网的规则为:
$cfg_df_namerule = ‘{typedir}/{aid}.html’.$cfg_df_ext;
栏目初始列表也类似。