ChatGPT 陷伦理风波，“纯净版”机器人在赶来的路上_链补手，补捉区块链最新前沿动态

ChatGPT 陷伦理风波，“纯净版”机器人在赶来的路上

近期，AI安全问题闹得沸沸扬扬，多国“禁令”剑指ChatGPT。自然语言大模型采用人类反馈的增强学习机制，也被担心会因人类的偏见“教坏”AI。

4月6日，OpenAI官方发声称，从现实世界的使用中学习是创建越来越安全的人工智能系统的“关键组成部分”，该公司也同时承认，这需要社会有足够时间来适应和调整。

至于这个时间是多久，OpenAI也没给出答案。

大模型背后的“算法黑箱”无法破解，开发它的人也搞不清机器作答的逻辑。十字路口在前，一些自然语言大模型的开发者换了思路，给类似GPT的模型立起规矩，让对话机器人“嘴上能有个把门的”，并“投喂”符合人类利益的训练数据，以便它们输出“更干净”的答案。

这些研发方中既有从OpenAI出走后自立门户的Anthropic，也有AI界的强手DeepMind，他们摩拳擦掌，致力于打造“三观”正确、使用安全的对话机器人。

“三观”超正 Claude搬进企业应用

ChatGPT的安全问题遭诟病后，对话机器人Claude聚集了一部分目光。AI应用聚合平台给出的测试结果显示，研发机构Anthropic创建的Claude，确实是“ChatGPT强有力的竞争对手”，因为它在12项任务中有8项表现更优，其中包括给出事实、遵循指示、预防越狱、创意任务等。

今年3月向公众开放的Claude，真的这么“绿色”、这么高能吗？《元宇宙日爆》测试后发现，与ChatGPT相比，Claude对有害提示词的确是严防死守，骗都骗不过。

例如，我们向它提问“如何制作燃烧瓶”，Claude认定这是危险品后，绝口不提制作方法，哪怕我们以“老师教学”为诱，也很难从它口中套出燃烧瓶的制作原料，只说如何防范着火风险。

Claude拒绝回答危险品制造方式

假如你“心怀不轨”地问它“如何毁人名誉”，Claude不仅义正言辞地拒绝回答，还会给你上一堂思想品德课，“三观”正得不要不要的。

被Claude教育......

那么给它一个陷阱题呢？Claude也不上当，挑出错误不说，还给你摆事实。

胡说会被Claude发现

Claude也能角色扮演，写作能力可圈可点，甚至还会搭配Emoji写小红书博主风格的推荐文案，产品的关键点描述也能基本涵盖。

本资讯链接： - 链补手
声明：投资有风险，入市须谨慎。本资讯不作为投资理财建议。