ai reddit - 搜索 News

资讯

Reddit凭借人类原创内容在AI时代获得新机遇

Reddit的成功部分归功于AI公司对该社区网站历史上人类原创帖子的需求，他们将这些内容用于模型训练。公司的数据许可业务（属于"其他收入"项目）达到3500万美元，同比增长24%。Reddit去年与 OpenAI 和谷歌建立了内容合作伙伴关系。今年6月，它起诉Anthropic以阻止无偿内容抓取。

腾讯网6 天

偷数据的AI公司被抓到了

AI公司发现通过Wayback Machine抓取Reddit的历史数据，既无需遵守Reddit的平台政策（如付费、合规协议），又能获取训练所需的大量内容，于是就利用这一漏洞开始了违规“曲线获取数据”的行为。 Reddit发言人Tim ...

3 天

速递｜Reddit创始人押注840万！Palabra攻克AI语音翻译“拟真实时”难题

Kukharenko 补充道，该公司已构建了一条定制化数据管道，使这家初创企业能在数周内轻松新增语言支持。他表示在管道末端，Palabra 会安排人工译员对输出质量进行校验。该初创公司称其算法还能适应嘈杂环境和对话中断等不同场景。

新浪网2月

玩完 DeepSeek R1 新版，外国网友又「蚌埠住了」？|AI ...

在各类 AI 社群中，reddit 平台有不少 AI/LLM 相关子社区。其中，在 r/LocalLLaMA 与 r/SillyTavernAI 这样的圈内社区，对 DeepSeek 的更新有不少热帖。

科技讯1 年

Reddit与谷歌达成AI训练数据协议价值数千万美元| 科技讯

在AI模型训练数据方面，各大AI公司都在积极与内容所有者达成合作，以避免潜在的版权问题。Reddit与谷歌的这次合作无疑为行业树立了一个典范 ...

10 天

企业在AI数据竞赛中如何重新掌控数据？Reddit 诉 Anthropic 的启示

最初，数据抓取只是业余爱好者的一种边缘策略，如今已演变成一个由商业数据聚合器驱动的、价值数百亿元的复杂生态系统——自动机器人在面向公众的网站上撒下大网，收集价格数据、产品列表、评论等，其速度通常比人类点击“刷新”的速度还要快。如今，这些实体经常绕过传 ...

7 天

Reddit封禁互联网档案馆，保护用户隐私防止AI公司滥用数据

Reddit宣布将封禁互联网档案馆（Internet Archive）的Wayback Machine工具，以防止人工智能公司非法抓取其数据。Reddit表示，已发现某些AI公司在通过Wayback Machine获取其数据，违反了平台政策。此次封禁措施将于即日起逐步实施，Wayback Machine将不再能够爬取Reddit上的帖子详情页、评论和用户资料，仅能索引Reddit.com的主页。