资讯

Reddit的成功部分归功于AI公司对该社区网站历史上人类原创帖子的需求,他们将这些内容用于模型训练。公司的数据许可业务(属于"其他收入"项目)达到3500万美元,同比增长24%。Reddit去年与 OpenAI 和谷歌建立了内容合作伙伴关系。今年6月,它起诉Anthropic以阻止无偿内容抓取。
AI公司发现通过Wayback Machine抓取Reddit的历史数据,既无需遵守Reddit的平台政策(如付费、合规协议),又能获取训练所需的大量内容,于是就利用这一漏洞开始了违规“曲线获取数据”的行为。 Reddit发言人Tim ...
图片来源:Palabra一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。如今,LLMs 使文本语言转换变得更容易,但 Reddit ...
由真人分享和整理的Reddit对话内容成为AI模型的重要信息来源,使Reddit在AI机器时代中意外脱颖而出。尽管广告仍是该公司主要收入来源,但AI授权业务也开始为其带来高利润增长。
AI 的出现,不过是把这种「外包」往前又推进了一步。它不仅仅是工具,而是开始代替我们「说出」本该我们亲自说出的话。「情感表达」变成了一种被设定的产出:你不需要真的感到愧疚,只需要 prompt ...
Reddit 在过去的 2024 年算得上是容光焕发。这家创立了近 20 年的社交平台,去年 3 月在纽交所完成上市,并在上市后的第三季度实现首次盈利,到 ...
IT之家 8 月 13 日消息,参考外媒 The Verge 当地时间 11 日报道,海外大型社区论坛 Reddit 宣布禁止互联网档案馆 (Internet Archive) 对该论坛非首页的绝大多数页面进行索引存档。Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit ...
Reddit 发言人在向媒体解释这一变化时表示,这是因为一些 AI 企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit 允许企业付费抓取 AI 所需的数据,但 经由互联网档案馆间接访问显然绕过了这一规定 。
在AI模型训练数据方面,各大AI公司都在积极与内容所有者达成合作,以避免潜在的版权问题。Reddit与谷歌的这次合作无疑为行业树立了一个典范 ...