今日头条如何分析用户标签及推荐系统的运作模式
- 关系
- 用户标签
除手机硬件外,还将分析用户安装的应用程序。例如,使用小米,三星和Apple组合模型和应用程序以分析,并且还有用于用户浏览器的书签。 将实时捕获用户的操作。它还包括用户订阅的渠道,例如电影,笑话,产品等。
4。推荐系统
推荐系统,也称为推荐引擎。它是技术架构的核心部分。它包括两种类型:自动推荐和半自动推荐系统:
1个自动推荐系统
- 自动候选人
- 自动匹配用户,例如用户地址定位,提取用户信息
- 自动生成推动任务
目前,需要高效率,大笔推送系统,数亿用户必须收到它们。
2个半自动推荐系统
- 自动选择候选文章
- 根据用户的网站内部和网站外的网站
的渠道分为分类渠道,兴趣标签渠道,关键字渠道,文本分析等,并且这些渠道都分为相对独立的开发团队。目前有300多个分类器,并且仍在添加新的用户模型。原始的用户模型无需无证件,并且仍然发挥作用。
当尚未发布帐户时,内容主要是从其他平台上爬网,然后是,每年数百万,而不是太大。它主要包括用户行动日志收集,兴趣收集和用户模型收集。
信息应用程序的技术指标,例如屏幕刷新,用户是否阅读了所有文章,以及逗留时间等,我们需要特别注意它。
5。数据存储
使用MySQL或Mongo持久存储 +(REDIS),并将许多库(大型内存库)划分,并且还尝试使用SSD产品。
的图片存储直接放置在数据库中,并以分布式的方式保存文件。阅读时使用CDN。
6。消息推
消息推送,用户:及时获取信息。对于操作,它可以改善用户活动。例如,在今天的推动之后,它可以将DAU增加约20%。如果没有推动力,它将影响大约10%的DAU(2015年数据)。
推送后要遵循的ROI:单击速率,单击计数。能够监视应用程序卸载的数量并推送禁用。
今天的推动的主要内容包括突然和热门话题,一些评论和答复以及网站注册外的朋友加入。
在头条新闻上,Push也被个性化:
- 频率个性化
- 个性化内容
- 地区
- 兴趣
例如:
据这座城市说:骗子发生了一个新闻事件,该事件发送给了乔阳的当地用户。
根据兴趣:例如,收购了第一商店,并将其发送给对感兴趣的用户。
推动平台的工具和选择需要满足以下标准:
- 频道必须先快速,但必须可控,可靠并保存资源
- 推动速度应该很快,可以在不同维度的政策支持下进行跟踪,并且开发界面应友好
- 推送操作的后端也应该很快,包括及时性,受欢迎程度和简单的工具操作
- 对于操作方,明确确定是否推荐,包括推送副本处理
因此,推送后端应提供每日报告,完成数据后端并提供A/B测试解决方案支持。
推动系统的一部分使用了自己的IDC,该IDC具有特别大的传输量,并消耗了严重的带宽。您可以使用类似于阿里巴巴云的服务,这可以有效节省成本。
7。扩展思维
现在,许多客户需要推荐电子商务和旅游产品建议等技术,还可以包括娱乐头条,健康头条,体育头条新闻和其他类似应用。这些产品在技术方面的实施,包括用户,模型和数据,都是相同的。