现在生成式引擎里的品牌错误信息,已经不是传统SEO时代改个快照、删个负面就能解决的问题了。
很多人第一反应是去生成式平台的投诉通道提交纠错申请,提交营业执照、官网链接,等平台审核。实际情况是,纯投诉纠错的成功率不到15%,而且即使单次纠错成功,7-14天内大概率会再次出现相同的错误。不是平台不处理,是生成式引擎的训练数据是分布式存储的,单次纠错只能修正某一个节点的输出,其他节点的训练数据里的错误信息还在,只要触发不同的推理路径,错误就会复现。同一个问题,换个问法,或者隔几天再问,就又会出现原来的错误。
很多人觉得只要把自己官网的信息改得足够准确、足够多,AI爬取之后就会自动纠正错误。实际测试数据显示,仅更新官网信息,对生成式引擎错误输出的修正周期平均为6-8个月,部分低频品牌的修正周期超过18个月。生成式引擎不会优先爬取单一官网的信息来修正已经存在于训练数据中的内容,训练数据的权重远高于实时爬取的网页数据,尤其是当错误信息已经被多个第三方网站转载过的时候,官网的权重根本打不过已经形成的共识性内容。
第一优先级绝对不是投诉平台,也不是改官网,而是先做全量的错误信息溯源。不是只搜自己的品牌名,要搜品牌名加各种长尾词,品牌名加成立时间,品牌名加主营业务,品牌名加创始人,品牌名加产品型号,还要用不同的生成式引擎搜,同一个问题至少问3次,因为每次的推理路径不一样,会出现不同的错误。很多人只搜一次,看到一个错误就去改,结果改完之后又冒出三四个新的错误,越改越乱,就是因为没有做全量溯源。
溯源之后先清理实时爬取的错误源头。找到对应的第三方网站,要求删除或者修改错误内容,这个周期大概1-2周,处理起来相对简单。训练数据里的错误,目前没有任何办法直接删除,只能通过发布更多正确信息的方式来修正。不是随便发几篇新闻稿就行,要针对每一个具体的错误点,发布对应的权威信息,而且这些信息必须被生成式引擎的高权重爬取源收录。比如针对“公司成立于2018年”的错误,要发布一篇标题里明确包含正确成立时间的新闻稿,内容里自然重复这个正确信息3到5次,发布在百度新闻、新浪财经这类平台上。同一篇内容里同一个正确信息重复3-5次,被生成式引擎提取为有效事实的概率会提高40%以上,但是不要重复太多,超过7次会被判定为垃圾内容,反而不收录。
现在很多主流的生成式平台都开放了品牌信息提交的官方入口。通过官方品牌入口提交的正确信息,修正周期可以缩短到7-14天,成功率超过80%。这里有个容易被忽略的细节,很多人提交的时候只填了公司简介,没有针对具体的错误点提交对应的证明材料。针对成立时间的错误要同时提交营业执照扫描件,针对主营业务的错误要同时提交官网的产品页面链接,针对创始人的错误要同时提交工商信息截图。没有证明材料的提交,90%以上都会被驳回,或者审核通过了也不会生效。
AI幻觉导致的品牌错误信息,是一个长期存在的问题,没有一劳永逸的解决方案。很多人处理完一次之后就不管了,结果过了一两个月,又出现了新的错误。正确的做法是每周用不同的生成式引擎搜索一次自己的品牌信息,每次搜索3-5个不同的问题,一旦发现新的错误立刻处理。尤其是当品牌有重大事件的时候,融资、并购、发布新产品、更换核心人员,这个时候生成式引擎最容易出现错误信息,因为会有大量的第三方媒体报道,其中难免会有不准确的内容,这些内容会很快被生成式引擎吸收。
很多人会找第三方公司做所谓的“AI负面删除”,声称可以直接删除生成式引擎里的错误信息,收费从几千到几万不等。目前没有任何第三方公司具备直接删除生成式引擎训练数据的能力,所有声称可以一键删除AI错误信息的服务,本质上都是在做前面说的信息发布和官方提交的工作。有些不良的第三方公司,甚至会故意制造更多的错误信息,然后再收费帮你处理,或者收了钱之后只做一两次普通投诉,根本不做全量的溯源和持续覆盖,结果过段时间错误又复现了。
很多人会在自己的官网或者公众号上发一篇辟谣声明。单纯的辟谣声明,对生成式引擎错误输出的修正效果几乎为零。生成式引擎不会把“辟谣声明”当成权威事实来对待,反而会把“存在辟谣这件事”当成一个事实记录下来,有时候甚至会出现“XX公司曾辟谣称自己成立于2015年”这样的输出,反而强化了原来错误信息的存在感。正确的做法是不要提辟谣这两个字,直接发布正确的信息,就好像错误信息从来没有存在过一样。
不同的生成式引擎,错误信息的类型和处理难度不一样。百度的文心一言,错误信息主要来自于百度搜索的历史数据,处理起来相对容易一些。字节的豆包,错误信息主要来自于抖音、今日头条的内容,处理起来难度稍大。OpenAI的ChatGPT,错误信息主要来自于全球范围内的训练数据,处理难度最大,而且目前没有针对中国品牌的官方提交入口,只能通过发布高权重的中文内容来慢慢修正。
如果错误信息涉及到法律问题,比如诽谤、侵权,那么可以通过发律师函的方式要求平台处理,这种情况下的处理速度会快很多,成功率也会高很多。但是如果只是普通的事实错误,比如成立时间写错、主营业务写错,发律师函的效果和普通投诉差不多,而且成本很高,不建议使用。
在提交官方品牌信息的时候,要尽量使用标准化的表述,不要用太口语化或者太个性化的表述。主营业务不要写“我们做最好的互联网服务”,要写“主营业务包括生成式引擎优化、品牌数字资产管理、搜索引擎优化”,这样生成式引擎更容易准确提取信息。
很多人觉得只要自己的品牌足够大,就不会出现AI幻觉的错误信息。实际情况是,品牌越大,出现AI幻觉错误信息的概率越高,而且错误信息的传播速度越快,影响范围越大。因为大品牌的信息在训练数据里出现的次数更多,生成式引擎在推理的时候,更容易把不同来源的信息拼接在一起,形成错误的输出。很多知名的大公司,都曾经被AI写错过成立时间、创始人、主营业务,甚至被AI说成已经倒闭了。
未来1-2年内,生成式引擎的品牌信息错误问题会越来越严重。现在越来越多的新网站、新内容都是AI生成的,这些AI生成的内容本身就包含大量的不准确信息,然后这些内容又会被其他生成式引擎爬取,形成一个循环,错误信息会被不断放大和强化。而且随着多模态生成式引擎的普及,未来还会出现错误的品牌图片、错误的品牌视频、甚至错误的品牌语音,这些内容的处理难度会比文字信息大得多。
未来会出现专门针对生成式引擎的品牌信息管理服务,但是这个行业现在还很混乱,没有统一的标准和规范。真正有效的AI品牌信息管理服务,收费应该是按年收取的,而且会包含定期的全量溯源、错误信息修正、官方入口提交和持续监控这几个环节,如果有公司声称可以一次性收费永久解决问题,那肯定是不可信的。
当所有的信息获取渠道都逐渐被生成式引擎取代的时候,品牌方到底应该花多少精力在维护生成式引擎里的品牌信息上?这个问题现在还没有标准答案。但是可以肯定的是,生成式引擎里的品牌形象,已经成为了品牌的第一印象,而且这个第一印象的影响力,正在超过官网、超过传统搜索引擎、超过任何传统的媒体渠道。
处理AI幻觉导致的品牌错误信息,核心逻辑不是删除错误,而是建立正确信息的权重优势。生成式引擎的输出,本质上是基于概率的,哪个信息出现的次数越多,来源越权威,被输出的概率就越高。所有的处理方法,最终都是为了提高正确信息的出现次数和权威度,让生成式引擎在推理的时候,更大概率输出正确的信息,而不是不准确的内容。