DeepMind发布GopherCite：讲话必须带证据

最近DeepMind发表了一项新研究GopherCite，使用根据人类偏好的强化学习（RLHP, reinforcement learning from human preferences）训练了一个可以用于开放式问答的模型。它不仅可以针对问题生成答案，在给出答案的同时，还会给出 AI 模型做出这些答案的依据，「引用」具体证据及其出处，以更好地帮助用户判断答案的正确性。支持证据（supporting evidence）主要来自搜索引擎返回的多个文档和用户提供的数据。