转眼6月就要过去了,在这段时间里面,文章采集系统又做了一些优化升级。
一:成本大幅度降低(vip学员可免费采集文章)
首先,文章采集系统的核心功能分以下几个模块:
1.头条文章采集
2.文章原创度检测
3.文章择优导出(内含seo优化算法,从每个关键词中导出1篇相关度最高的文章并自动优化标题)
4.文章优选导出(一键批量导出符合条件的文章,并自动生成两段式标题)
最初发布的采集系统,使用成本如下:
(采集1篇文章扣2碎片,检测原创度1篇文章扣4碎片。(提示:1碎片=1分钱人民币)
经过不断优化,目前最新使用成本如下:
采集文章免费(每日有限额),检测原创度1篇文章扣1碎片。择优导出+标题自动优化等功能免费(无限额)。
什么意思呢?再把最新的使用成本说具体一点。
vip会员每日可免费采集【500】篇文章,超出部分【1】篇文章扣【1】碎片。
vip会员检测文章原创度,【1】篇文章扣【1】碎片(1分钱)。
vip会员使用择优导出(该导出内含seo优化算法),免费无限制。
vip会员使用优选导出,(该导出会自动生成两段式标题),免费无限制。
提示:采集文章时,大家可以选择检测原创度,也可以选择不检测。
二:积分记录/使用记录完善。
说起这个功能,更多的是无奈,原本这系统我们就自己人用,不需要记录什么东西,毕竟记录这些数据也要占据服务器资源,白白增加服务器+运营成本。
但有一天,仟烛老师那边遇到两个学员,上来就质问为什么自己的碎片没有了,实际上该学员是采集文章消耗了,但由于没有使用记录,所以最后只能赔偿该学员碎片。
也好,现在所有的积分记录已经完善了,如图:
三:增加更多采集细节设置
1:支持过滤文章字数
采集之前可以先设置好,比如设置为1000,那么你采集的所有文章,字数都会大于1000。
2:支持过滤文章内容/文章标题
采集之前设置好过滤关键词,这样采集到的文章就不会出现这些词了,可以避免一些法律法规风险哦~
3:过滤指定作者的文章:
采集前设置好,这样就不会采集到这些作者的文章了。
四:原创度检测算法优化
文章原创度检测原理分享:
第一步:把1篇文章,按照38个字为一段,拆分成若干段落。
第二步:把文章段落放到百度进行搜索,得到搜索结果。
第三步:搜索结果中,会出现不同程度的飘红情况,软件会根据飘红百分比进行打分计算。做个案例图:
(以下案例图仅做部分讲解演示,不代表算法的所有部分)
第四步:把所有段落的分数取一个平均值,得出的就是该文章的原创分。
了解以上原理后,近期原创度检测支持自己调整检测等级了:
一共5个检测等级。
1级,检测1篇文章,会随机抽取5个段落进行检测,总共扣1个碎片(1分钱)
2级,检测1篇文章,会随机抽取10个段落进行检测,总共扣2个碎片(2分钱)
3级,检测1篇文章,会随机抽取15个段落进行检测,总共扣3个碎片(3分钱)
4级,检测1篇文章,会随机抽取20个段落进行检测,总共扣4个碎片(4分钱)
5级,检测1篇文章,会随机抽取25个段落进行检测,总共扣5个碎片(5分钱)
注意:本文以上所讲的积分标准建立在咱们内部使用人员的标准上。 如您是免费用户,请参考此处最新标准:
https://www.huayuno.com/plugin.php?id=keke_help&catid=8