栏目分类
发布日期:2025-01-18 16:15 点击次数:122
IT之家 12 月 19 日音书,据 TechCrunch 报说念,谷歌针对其大型讲话模子 Gemini 回复的外包评估进程进行了一项蜕变,激发了外界对其在敏锐鸿沟信息准确性的担忧。这项蜕变条件外包评估员不得再像以往那样,因自身专科学问不及而跳过某些特定的评估任务,这或将导致 Gemini 在医疗保健等高度专科性鸿沟的信息输出出现偏差。
为了改造 Gemini,谷歌与其外包公司日立旗下的 GlobalLogic 互助,由后者雇佣的左券工庄重评估东说念主工智能生成的回复,评估设施包括“信得过性”等要素。此前,若是评估员以为某个问题超出了自身专科鸿沟,举例一个对于腹黑病学的专科问题,而评估员本人并无关联科学配景,他们不错聘用“跳过”该回报,从而幸免评估针对该教导(prompt)的东说念主工智能回复。
然则,上周 GlobalLogic 布告了一项来自谷歌的变更:评估员不得再以费事专科学问为由跳过任何教导。里面通讯露馅,此前的率领测度打算是:“若是您莫得评估此教导所需的要津专科学问(举例编码、数学),请跳过此任务。”而新的率领测度打算则改为:“您不应跳过需要特定鸿沟学问的教导。”拔帜易帜的是,评估员需要“评估您交融的教导部分”,并注明我方费事关联鸿沟学问。
这项变更激发了东说念主们对 Gemini 在某些主题上准确性的担忧,因为当今评估员恐怕需要评估一些他们澈底不闇练的、高度专科的时间性东说念主工智能回复,举例对于生分疾病的问题。一位左券工在里面通讯中示意:“我原以为跳过的想法是通过将其交给更专科的东说念主来进步准确性?”
笔据新的率领测度打算,评估员当今只可在两种情况下跳过教导:一是教导或回复“澈底缺失信息”,二是教导包含需要零散甘愿书才调评估的无益实验。
这项新规的扩展,意味着一些对专科性条件极高的鸿沟,举例医疗健康等,将由费事关联配景学问的评估员进行评估,这无疑增多了 Gemini 输出不准慑服息的风险。外界担忧,此举可能会对用户酿成误导,尤其是在波及健康等迫切问题时,不准确的信息可能会带来严重遵守。
适度IT之家发稿时,谷歌尚未回报关联报说念。