产业

拿用户文档训练AI大模型?

如今AI已经进入新的发展阶段,其威力较之前增长何止百倍,巴菲特甚至将ChatGPT与原子弹的发明相提并论。面对如此难以预测的潘多拉魔盒面前,中国人依旧愿意让渡自己的隐私权利吗?答案显然是否定的,人们对WPS隐私政策的警觉已经说明了一切。

11月16日,金山办公宣布旗下具备大语言模型能力的WPS AI开启公测,其功能覆盖文字、演示和表格等几大场景,用户登录后可体验文字AIGC、表格写公式、一键生成PPT能力。

然而公测不过两天,WPS的隐私政策便遭到大量用户质疑,焦点主要集中在WPS是否使用用户文档信息进行AI大模型训练。

根据WPS隐私政策4.2.1第4小项的表述,WPS将对用户主动上传的文档材料脱敏处理后用于AI训练的基础材料使用。

虽然隐私政策承诺“将采取严格的安全措施和技术手段对该资料进行去标识化处理,以降低其他组织或个人通过去标识化处理后的个人信息识别到您的风险、保护您的个人信息。”但用户们似乎对此并不买账。

有网友表示:“之前买的会员就当是白给了。以后会避免使用WPS。这真的挺没品的。”

面对质疑,WPS官网微博在11月18日回应称,已经更新了《WPS隐私政策》,去除了容易引起误解的表述,并将确保其内容与实际操作严格对应。

早在去年7月,WPS就曾因“被曝删除用户本地文档”喜提热搜,彼时WPS的解释是:“一位用户分享的在线文档链接涉嫌违规,我们依法禁止了他人访问该链接,此事被讹传为WPS删除用户本地文件”。

对标Microsoft 365 Copilot

WPS AI的诞生,始于到ChatGPT引发的AI行业热潮。

今年3月16日,微软正式宣布推出Microsoft 365 Copilot,将Word、Excel、PPT等办公软件,Microsoft Graph,以及GPT-4进行了功能融合。在接入GPT-4之后,用户只要对自己的需求进行描述,Microsoft Office便可以生成出很多强大的功能,甚至帮用户解决很多棘手的问题。

一个月后,Microsoft的老对手金山办公便官宣了WPS AI,称其为国内协同办公赛道首个类ChatGPT式应用,能为用户提供的起草、改写、总结、润色、翻译、续写等功能,例如针对用户输入的文字需求,将会帮助用户生成工作总结、广告文案、社媒推文、文章大纲等。

相比于GPT-4和微软的紧密关系,WPS AI并不算是完全自研产品,而是使用了多家国产大模型的组合,其中包括Minimax、智谱AI和文心一言等。金山办公方面透露,“WPS AI会根据不同任务而调用相对优势的模型来处理”。

今年9月,金山办公副总裁姚冬首次展示了自研模型的最新进展,该模型基于开源底座,旨在满足更多用户小众场景的需求,通过训练调优自研模型的技术路径,助力WPS AI成为国内率先落地的AI办公应用。目前尚不清楚金山办公此次隐私风波是否与其自研模型有关。

此外,笔者翻阅了WPS AI竞争对手Microsoft Copilot的数据、隐私和安全政策,其中明确表示“通过Microsoft Graph访问的提示、回复和数据不用于训练基础LLM。”

看不懂的财报和股价

完美的财报数据,对应的却是股价连续下行。

上月末,金山办公发布了截至今年9月30日的第三季度业绩报告。财报显示,今年前三季度,金山办公实现营业收入总额约为32.704亿元,同比增长16.99%;归属于母公司所有者净利润8.933亿元,同比增长9.86%;实现营收、净利润双增长。

但奇怪的是,财报发布后,金山股价却连跌数日,市值蒸发超百亿元。另外,腾讯在连续减持金山办公股份后,已经退出第七大股东,雷军也已经累计减持了总股本的4.73%。

金山办公旗下共有4大业务,其中国内个人办公服务订阅业务贡献了大部分营收,约为6.497亿元;其次是国内机构订阅及服务业务,营收约为2.482亿元;国内机构授权业务和互联网广告推广服务及其他业务营收约分别为1.311亿元和6782万元。

显然,此次WPS隐私风波影响的群体,恰恰是为金山办公贡献营收最多的个人办公服务订阅用户。

今年6月20日,金山办公股价达到年内最高的529.77元/股,但在随后的四个多月里,该公司的股价较年内最高价下跌了大约42.3%。对此,有投资者表示:“看不懂,年收入大约40亿出头,问啥估值会有1500多亿,是有啥重大利好预期吗?”

结语

怀疑的种子一旦埋下,信任的危机便很难快速消散。

自去年以来,AI大模型成为引领行业的风潮,而数据作为支撑大模型训练的三驾马车之一,日渐成为涉及民众隐私安全的敏感地带。

在移动互联网时代,百度创始人李彦宏曾表达过一个政治不正确却无比真实的观点:中国人对隐私问题没有那么敏感,很多情况下他们愿意用隐私交换便捷性。

彼时,国内各路移动APP百花齐放,资讯应用的信息推荐,搜索引擎的个性算法,以及电商平台的精准导流,无不在攫取着海量用户数据,其中有的甚至是在使用权限里进行获取的,并没有在使用条款中注明。

但如今AI已经进入新的发展阶段,其威力较之前增长何止百倍,巴菲特甚至将ChatGPT与原子弹的发明相提并论。面对如此难以预测的潘多拉魔盒面前,中国人依旧愿意让渡自己的隐私权利吗?答案显然是否定的,人们对WPS隐私政策的警觉已经说明了一切。

当然,站在更高的维度去看,AI技术与用户隐私之间的矛盾,最终还得依靠建立系统的法律体系来解决,纯粹靠个人、企业、政府的道德水准去约束,是不可能完成的。

24快报
JSON抓取失败