Twitter在周五宣布,将开源平台使用的推荐算法背后的代码,以选择用户“为您推荐”时间轴中的内容。 然而,今天公开的代码不包括广告推荐背后的部分或可能危及Twitter保持威胁行为者试图操纵平台控制能力的部分。 公司表示:“对于此版本发布,我们旨在实现最高程度的透明度,同时排除任何可能损害用户安全和隐私或保护我们免受恶意行为者侵害(包括破坏我们打击儿童性剥削和操纵方面努力)能力的代码。
今天的发布还不包括推动我们广告推荐的代码。我们还采取了额外措施,以确保用户安全和隐私得到保护,包括决定暂时不公开与 Twitter 算法相关的训练数据或模型权重。
Twitter已经发布了两个独立的GitHub存储库,其中包含其推荐算法的源代码和一些支持它的机器学习(ML)模型。
正如该公司的工程团队透露的那样,出现在“为你推荐”时间线中的推文是由一个名为Home Mixer的服务选择的,它使用以下流程: 从不同的推荐来源获取最佳推文。 使用机器学习模型对每个推文进行排名。 应用启发式和过滤器,例如过滤掉来自已屏蔽用户、NSFW内容和您已经看过的推文等。 Twitter解释说:“对于每个请求,我们通过这些来源尝试从数亿条数据池中提取最好的1500条推文。” “我们从您关注(内部网络)和未关注(外部网络)人员中寻找候选人。”
最终目标是让每个用户“为你推荐”时间线显示50%来自他们关注者相关且最新发布的推特以及另外50%来自不在其社交网络之内但基于用户感兴趣内容而筛选出来。
几个月前Twitter源代码泄漏到网上
本月早些时候,Twitter下架了GitHub上泄露并公开可用至少几个月之久专有源代码和内部工具。
在DMCA侵权通知中,该公司还要求GitHub提供有关泄漏代码下载历史记录信息, 可能是想查明谁在代码在线可用时下载了该代码。
Twitter 正试图使用在美国加利福尼亚北区地方法院提交的传票,强制要求 GitHub 共享 FreeSpeechEnthusiasm 用户发布文件和访问、分发泄露的 Twitter 源代码的任何人的身份信息,这可能也会用于进一步的法律行动。 今天的公告是在 Twitter CEO Elon Musk 发布推文承诺将使 Twitter 算法公开之后发布的。 第一个是一个投票(来自2022年3月24日),询问用户是否应该“开源Twitter算法”,而第二个(来自2023年3月17日)则表示,“Twitter 将于 3 月31日开源所有用于推荐推文的代码”。
暂无评论内容