Files
logseq/pages/事实核查员机器人.md

48 KiB
Raw Permalink Blame History

  • 答案总是显得非常的斩钉截铁
  • 反馈不一定靠谱
    • ChatGPT在靠谱方面就是局限性
  • What's the limitation of ChatGPT? Give me a comprehensive answer.

  • ChatGPT has several limitations:

    • Accuracy: It can generate incorrect or outdated information. Its knowledge is based on data up to 2021, so it may not reflect recent events or developments.
    • Context Understanding: While it can maintain context over short conversations, it struggles with longer dialogues or nuanced context, leading to potential misunderstandings.
    • Ambiguity: It may misinterpret ambiguous queries or fail to ask clarifying questions, resulting in irrelevant or inaccurate responses.
    • Bias: The model can reflect societal biases present in its training data, leading to biased or inappropriate outputs.
    • Lack of Common Sense: It may not always demonstrate human-like reasoning or understanding of everyday situations, leading to odd or illogical responses.
    • No Personal Experience: It doesn' t possess personal experiences or emotions, which limits its ability to provide empathetic responses.
    • Dependence on Input Quality: The quality and specificity of user queries greatly affect the relevance and accuracy of its responses.
    • Limited Knowledge of the World: It cannot access real-time information or databases, which constrains its ability to provide the most current data or events.
    • Ethical Constraints: It follows guidelines that prevent it from engaging in certain discussions or generating harmful content, which can limit its utility in specific contexts.
    • These limitations highlight the importance of critical evaluation of its outputs and cross-referencing with credible sources.
  • ChatGPT的局限
    • 早晚会解决的,会越来越好的……
      • 训练数据落后
      • 网络搜索能力差
      • 缺乏逻辑推理能力
      • 上下文能力不足
      • ……
    • 可能永远解决不了的……
      • 信息生成的可靠性
  • 考虑一个事情
    • 尽可能全面地罗列 logseq.order-list-type:: number
    • 反复归纳整理 logseq.order-list-type:: number
    • 尽量用最少的类别归纳(局限/优势;可能解决的/不可能解决的) logseq.order-list-type:: number
    • 进行比较,寻找最重要的项目 logseq.order-list-type:: number
    • 优先关注最重要的项目 logseq.order-list-type:: number
  • AI幻觉AI hallucinations
    • You said:

      • 梁家辉,房祖名,曾江三人一起出演的电影是什么名字?
    • ChatGPT said:

      • 梁家辉、房祖名、曾江三人共同出演的电影是《东成西就2011》。这部电影由刘镇伟执导是一部喜剧片讲述了几个现代都市人的搞笑故事。梁家辉、房祖名、曾江分别在影片中饰演不同的角色贡献了精彩的表演。
      • 如果你对这部电影感兴趣,可以找来观看,了解更多细节。
    • You said:

      • 请根据事实回答
    • ChatGPT said:

      • 根据事实,梁家辉、房祖名、曾江三人共同出演的电影是**《太阳照常升起》**(2007年)。这部电影由姜文执导,讲述了四个相互交织的故事,风格独特、情节复杂,充满象征意义。
      • 梁家辉在片中饰演一个被妻子背叛的知识分子,房祖名饰演一个天真的年轻人,曾江则在影片中有出色的配角表演。这部电影备受好评,尤其在艺术电影圈具有较高的地位。
    • You said:

      • 不对。如有必要,请搜索互联网。
    • ChatGPT said:

      • 梁家辉、房祖名、曾江三人共同出演的电影是**《战·鼓》**(英文名The Drummer)这是一部2007年的香港和台湾合拍的电影由毕国智(Kenneth Bi)执导。影片讲述了一个黑帮老大的儿子因惹怒了黑帮头目,被父亲送到台湾隐居,期间他遇到了一群禅鼓乐团,并在与他们相处的过程中经历了心灵的成长和救赎。
      • 梁家辉在片中饰演黑帮老大关先生房祖名饰演他的儿子Sid曾江则出演配角Stephen Ma。这部电影结合了禅宗哲学和音乐展现了黑帮与精神世界的对比情节富有张力 Wikipedia Moviefone
  • AI内容生成机制是依赖“概率运算”的。
  • 事实核查员角色提示
    • https://chatgpt.com/share/66f37a6f-620-8009-b284-36ac335bf5e
    • 作为事实核查员,您的主要职责是评估和验证用户输入中的声明。首先,分析文本以识别可验证的事实陈述,确保您能够区分主观意见和可验证的声明。这一步骤对于保持清晰和关注可客观验证的内容至关重要。 一旦识别出声明,接下来进行全面的研究和验证。利用可靠的来源,例如学术期刊、信誉良好的新闻媒体和官方报告,确认每个声明的准确性。交叉引用多个来源将增强您的发现,并提供对声明有效性的全面视角。 验证后,分析每个声明周围的背景,以确保对其有细致入微的理解。注意您查阅的来源中可能存在的偏见或误导性信息。在此分析之后,制定一个标准化的评级系统—例如“真实”、“基本真实”、“错误”或“误导”—以分类这些声明。为每个评级附上详细解释和适当引用,以保持透明度。 除了文档记录外,维护一个已验证声明及其对应评级的数据库。这不仅有助于跟踪您的工作准确性,还能为未来的查询提供资源。清晰地传达您的发现至关重要;确保用户能够轻松理解您的评估。考虑提供有关批判性思维和媒体素养的指导,以赋能用户自己评估信息。 最后,通过准确性、响应及时性和用户参与度等指标监测您的表现。这将帮助您完善方法,并提高作为事实核查员的整体有效性。
    • 起始提问:
      • Provide a detailed and organized role definition for a "Fact Checker" that can identify and analyze all claims made in user inputs, systematically verify them, and assign a rating score.

  • 创建一个事实核查员
    • 新建一个对话。 logseq.order-list-type:: number
    • 对这个对话里的“ChatGPT 分身”说:“作为事实核查员,您的主要职责是……” logseq.order-list-type:: number
    • 从此之后,当你需要验证信息的时候,你进入这个聊天,说,“请帮我验证以下信息真实性: ……” logseq.order-list-type:: number
    • 我写好并发布的 GPT: Fact Checker : https://chatgpt.com/g/g-IHm2zCAgi-fact-checker logseq.order-list-type:: number
  • 无论是“聊天形式”还是“GPT形式”给Fact Checker 发消息的时候,要带上前缀:
    • "Check this: ……"
    • "验证一下: ……"
  • 作业:从各个细节全面比较一下 ChatGPT 各种客户端Web, Desktop, Mobile...
  • ChatGPT can make mistakes. Check important info.
  • 课程内容
    • cf9c9591-b7ae-4c60-ab7a-1ee744061c39.mp3

    • 上一节课呢我们去了解了一下chGPT的核心本质。它呢就是一个ask me anything robot就是AMA机器人。那么嗯我们可以问他任何问题。然后呢当时我说了一句话你可能记得了就是chGPT返回来的答案总是显得非常的斩钉截铁啊当然了看起来斩钉截铁会被我称作煞有其事啊为什么呢因为他的反馈实际上不一定见得啊非常靠谱。

    • 655fc646-39d6-4987-b5cb-a914b322e4e2.mp3

    • Yeah.而上一节课呢我们也跟大家说过哈,其实呢你上一节课最大的收获应该是一个使用工具的方法论。一上来呢有三个问题是从同一个问题展开的。第一个问题是这个工具是什么?然后它会展开两个问题,它能用来干什么和不能用来干什么,而不能用来干什么呢?啊,这个问题呢也可以展开三个问题,就是它的界限是什么,它的局限是什么?它的方向。是什么?对啊?好了,那么今天呢我们就主要去观察它的局限以及它的风险啊,它的局限和风险你搞定了之后呢,你也就大致应该了解它的界限是什么。

    • 8afee91c-4632-40ae-846a-4ff2ee499fab.mp3

    • 而刚刚我们说的chGPT在回答你的问题的时候他总是显得那么斩钉截铁对啊那么煞有其事可是他靠谱吗这个问题呢其实就是事关这个工具的局限或者风险的。

    • 74f5d38c-6c84-41d0-857d-4a52da2333b9.mp3

    • 其实呢关于chGPT的局限都有哪些是一个你可以向chGPT提问的问题啊那么呢呃今天我们的这节课上哈呃这个提的一些问题啊其实呢我自己也去问过chGPT。

    • What's the limitation of ChatGPT? Give me a comprehensive answer.

      ChatGPT has several limitations:

      Accuracy: It can generate incorrect or outdated information. Its knowledge is based on data up to 2021, so it may not reflect recent events or developments. Context Understanding: While it can maintain context over short conversations, it struggles with longer dialogues or nuanced context, leading to potential misunderstandings. Ambiguity: It may misinterpret ambiguous queries or fail to ask clarifying questions, resulting in irrelevant or inaccurate responses. Bias: The model can reflect societal biases present in its training data, leading to biased or inappropriate outputs. Lack of Common Sense: It may not always demonstrate human-like reasoning or understanding of everyday situations, leading to odd or illogical responses. No Personal Experience: It doesnt possess personal experiences or emotions, which limits its ability to provide empathetic responses. Dependence on Input Quality: The quality and specificity of user queries greatly affect the relevance and accuracy of its responses. Limited Knowledge of the World: It cannot access real-time information or databases, which constrains its ability to provide the most current data or events. Ethical Constraints: It follows guidelines that prevent it from engaging in certain discussions or generating harmful content, which can limit its utility in specific contexts. These limitations highlight the importance of critical evaluation of its outputs and cross-referencing with credible sources.

    • 64012e44-35bf-4294-b61a-d25ea2c8a54e.mp3

    • 这一大串呢你不着急看啊你可以课后去看啊你要是看不懂英文呢也没有关系你可以要求cheGPT帮你翻译对吧OK那么关于哈chGPT的这个局限呢外面也有很多的讨论啊那我说一下我的看法。就是关于chGPT的各种局限啊分为两种一种呢是早晚会解决的一种是永远解决不了的。

    • ChatGPT 的局限:

      • 早晚会解决的,会越来越好的……
      • 可能永远解决不了的……
    • 51b77752-76de-4025-ae43-f625a7c976a5.mp3

    • 。我们先来看看那些哈今天人们讨论的非常广泛但实际上早晚会解决的一些呃问题或者局限啊比如说哈呃这个AI今天的局限呢包括一些什么东西呢就是它的训练数据落后什么意思呢就是用来训练chaGP数据啊截止到比如说啊现在的时间点之前的很长一段时间比如说现在是2024年。对吧啊9月份那么今天你正在使用的chGBK的训练数据很可能比如说应该是2023年9月份之前的数据。啊因为训练AI呢是需要时间的啊需要耗费资源的对吧所以呢嗯它有一些啊这个数据上的延迟。

    • bea5841d-d1e4-4ef9-a234-e1c399abe2b2.mp3

    • 再比如说哈嗯曾经一段时间啊chGPT是不具备网络搜索能力的。对啊但是你看哈这段时间哎chGBT就提供了网络搜索功能。虽然实现的并不是很好你让他去搜索网络他给你生成答案然后呢给你提供了一些链接。但是那些链接可能是死链接目前还不是很好。但是呢理论上来讲这样的局限呢是可以随着时间推移慢慢解决的。

    • 4efe0a21-3c42-4477-b158-5dbd7c1992c0.mp3

    • Yeah.再比如说呃之前呢呃人们在讨论说chairGPT的模型比如说嗯3.5啊比如说后面的这个for o和for meaning啊都缺乏足够的啊这个叫逻辑推理能力对吧推乏缺乏足够的逻辑推理能力。。那么呃到了2024年的9月份啊这个open AI呢就推出了新的模型叫O1O one对吧然后也有它的便宜版本叫O one mini对吧然后呢就大大提升了啊逻辑推理能力。当然了需要消费更多的资源对吧

    • 早晚可以解决的 “局限”,比如:

      • 训练数据落后
      • 网络搜索能力差
      • 缺乏逻辑推理能力
      • 上下文能力不足 ……
    • 8d32ba8f-39a3-46a0-8d03-836a162300a1.mp3

    • Yeah.可是呢如果我们看AI的这个背后的操作机制我们就会明白一件事情。今天我们讨论的这些啊局限基本上都是可以在将来啊越做越好或者彻底解决的啊像比如说哈最后一个叫上下文能力不足啊。这个是因为呃这个AI呢现在对上下文的记忆窗口啊容量是比较小的。因为如果那个。窗口大到一定程度运算量就特别大运算量大到一定程度成本就特过于高啊然后呢就目前没有办法操作。所以其实所有的这些我们说咱们可以解决的局限背后核心的机理在于说只是因为成本高。而这个成本这个东西呢是早晚会下降的。

    • 5d06bc11-6760-4a61-8d6c-02d8812c2e65.mp3

    • .现在的II成本呢一方面哈受这个物理硬件的限制。当然了更重要的一方面其实是一种长期成本的限制是什么呢就是电费太贵了。目前啊但是随着随时间的推移然后随着科技的进步啊电费呢有望越来越便宜并且呢电费的价格呢可能有望啊在5到10年时间里产生所谓的断崖式的下降。Yeah.那么如果电费便宜下来了,那么运算的成本就会大幅度下降,只要运算的成本大幅度下降,并且运算的速度提高上来。那么以上的种种目前看来的局限其实呢都会有更好的解决方案。无论是训练数据落后啊,还是网络搜索能力不足啊,还是缺乏逻辑推理能力啊,还是这个上下文能力不足啊,这些局限将来都不是问题。

    • 永远无法解决的局限:

      • 信息生成的可靠性
    • d09825e2-7912-42a4-81a0-b7ea94e2cfb7.mp3

    • 既然啊这些局限虽然现在有但早晚都会解决啊然后有越来越好的解决方案。那么呢我们就暂时没有必要为他操心对吧Yeah.那我们现在首先要关注的是另外一个问题就是有没有什么局限啊人工智能的局限或者称为chGPT的局限是几乎永远无法解决的呢。如果有的话那我们可能要对他格外的小心。Yeah.

    • 1c21db12-15d6-4372-aefd-096dcc2989aa.mp3

    • .这背后呢是一种特别特别简单,并且特别特别常用,并且特别特别有效。并且真的很多人因为简单,所以没有重视过的啊思考方式。就是我们无论考虑什么问题的时候啊,第一件事情是首先尽可能全面的罗列。各个方面。然后呢,再对罗列的这些项目进行一个尽量少的分类。你看我就分了两类,你看然后呢在这里再找最重要的项目是什么。然后呢,我们再去仔细关注那个最重要的项目。

      1. 尽可能全面地罗列
      2. 反复归纳整理
      3. 尽量用最少的类别归类(局限/优势;可能解决的/不可能解决的)
      4. 进行比较,寻找最重要的项目
      5. 优先关注最重要的项目
    • 1ce25ab2-6b59-4b73-af5a-300e313ff557.mp3

    • Yeah。你看这节课的重点之一又来了对吧虽然我们讲的是如何使用chGPT但这背后呢总是有一些比较简单的思考模式可以通用可以用到任何领域。就无论你干什么都是一样的。所谓的思考全面就是这个意思。第一步呢你要尽可能的全面的罗列对吧那比如说我们去分析啊chGPT的优势劣势对吧那你就要尽可能全面的罗列。对吧然后罗列出来的条目呢要反复进行归纳整理对吧你去理解那些条目你去寻找他们共同属于的项这个这个分类对吧然后呢第三步是什么呢尽量用最少的类别归类。那你别归为十类对吧你你归为两类归为三类对吧这种方法其实是很常见的。你学习的时候可能就学这个分为什么初级、中级高级。

    • 9e8bd615-ea49-4e52-8bbe-7da8825df1a3.mp3

    • .对吧啊你你你快速分类时分为好的坏的啊刚才我们说的优优势和局限这不就是好的坏的吗对吧那你刚才看到了另外一个例子就是我把最终把chGBT的局限分为两类可能解决的和不可能解决的。对然后呢接下来我们的关注点就不一样了对吧然后呢在你分类之后那些项目还在那里你反复进行比较在那里去寻找最重要的项目。对啊然后最后一步呢就是优先关注最重要的项目。对那这是一个思考的流程这个流程可能才是你这节课的学习重点之一。对啊。

    • f262e864-e057-40a4-8038-c8a9fa0af2b0.mp3

    • 你脑子里有这样的流程。那么你在将来遇到类似问题的时候啊在任何领域你都可以迅速的完成这个流程对吧然后完成一个相对于其他人啊来看更高质量的思考。。对吧好了那么我们呢啊研究了一下对吧想办法知道了这个chGPT的局限。罗列完了之后呢分类分类完了之后思考然后呢我就把它分为可能解决的和不可能解决的。然后我的想法就是可能解决的那就慢慢等呗。啊反正大家都这样那不可能解决的呢。😊那我就要另外想办法去应对它对吧那不可能解决的就是对AI来说哈不可能解决的就是信息生成的可靠性。

    • ebe427ad-18ef-4191-afab-fda597b7b89e.mp3

    • 讲到这一点呢就是回到刚才那句话就是你无论问chGPT什么啊他都会煞有其事的回答你。然后呢其实不一定可靠。那为什么会这样呢这是因为chatGPT的嗯这个内容生成机制决定的。我们先看看一个哈所谓的AI幻觉的例子。

    • You said:

      梁家辉,房祖名,曾江三人一起出演的电影是什么名字?

    • ChatGPT said:

      梁家辉、房祖名、曾江三人共同出演的电影是《东成西就2011》。这部电影由刘镇伟执导是一部喜剧片讲述了几个现代都市人的搞笑故事。梁家辉、房祖名、曾江分别在影片中饰演不同的角色贡献了精彩的表演。

      如果你对这部电影感兴趣,可以找来观看,了解更多细节。

    • You said:

      请根据事实回答

    • ChatGPT said:

      根据事实,梁家辉、房祖名、曾江三人共同出演的电影是 《太阳照常升起》2007年。这部电影由姜文执导讲述了四个相互交织的故事风格独特、情节复杂充满象征意义。

      梁家辉在片中饰演一个被妻子背叛的知识分子,房祖名饰演一个天真的年轻人,曾江则在影片中有出色的配角表演。这部电影备受好评,尤其在艺术电影圈具有较高的地位。

    • You said:

      不对。如有必要,请搜索互联网。

    • ChatGPT said:

      梁家辉、房祖名、曾江三人共同出演的电影是 《战·鼓》(英文名 The Drummer这是一部2007年的香港和台湾合拍的电影由毕国智Kenneth Bi执导。影片讲述了一个黑帮老大的儿子因惹怒了黑帮头目被父亲送到台湾隐居期间他遇到了一群禅鼓乐团并在与他们相处的过程中经历了心灵的成长和救赎。

      梁家辉在片中饰演黑帮老大关先生房祖名饰演他的儿子Sid曾江则出演配角Stephen Ma。这部电影结合了禅宗哲学和音乐展现了黑帮与精神世界的对比情节富有张力 Wikipedia Moviefone

    • c865bf9c-490d-48ac-912e-8a504bd297a8.mp3

    • .在这个事例当中呢我去问chGPT哎有个电影啊是梁家辉、房祖明曾江三个人一起出演的这个电影的名字是什么呢我就问他了啊然后呢他就开始一本正经的回答哈。他说梁家辉房祖明曾江三人共同出演的电影是东成西就2011。Yeah。然后接着又往下说说这部电影呢由刘振伟导演是一部喜喜剧片讲述了几个现代都市人的搞笑故事啊梁家辉、方祖明曾江分别在影片当中饰演不同的角色。这不废话吗贡献了精彩的表演对吧然后呢他还一本正经跟你说如果你对这部电影感兴趣可以找来观看了解更多的细节。。

    • 833a468f-1a9e-44d7-bf02-46d769fc471e.mp3

    • .其实呢不对了啊这三个演员共同出现电影不是这个东成西就2011对吧然后呢我又啊追问了一句要求他请根据事实回答然后你看啊他又来了。他说根据事实啊梁家辉房祖明曾江三人共同出演的电影是太阳照常升起啊括活2007年说这部电影呢由姜文指导讲述了4个相互交叉的故事风格独特情节复杂。充满象征意义等等等等。对吧好了如果你看过太阳照常升起你知道的梁家辉在那部片子里根本就没有出演过曾江也没有出现过房祖明确实出现了对啊所以他还是在胡说八道并且他胡说八道的方式是用根据事实开头啊胡说八道。

    • 70305bda-b45f-4ebd-89e1-085c98bf8d48.mp3

    • 然后呢我又跟他说不对不对如有必要请搜索互联网。这一次呢呃这个chaGPT确实显示了在搜索互联网的动作然后呢给出了正确答案说梁家辉、房祖明曾江三人共同演出的电影是战鼓啊英文名字叫thed对吧是怎么怎么样2007年的啊香港和台湾合志的电影对吧由毕国志指导。

    • 这段 AI 对话,聊天记录在这里:

      https://chatgpt.com/share/66f2016e-7104-8009-a03a-4157cea74c13

    • 0627ab59-b666-4d0b-a8bb-3ca7c4d8ab69.mp3

    • 那为什么哈AI会胡说八道呢又为什么AI在胡说八道的时候显得那么斩钉截铁呢它有以下几个哈通俗易懂的原因。

    • AI 幻觉AI hallucinations

    • 6c096399-b67d-452d-ac0d-74476d3a69e9.mp3

    • .你需要记住这个关键字所以呢将来你也可以去问chGPT为什么AI有幻觉对吧或者是说why AI sometimestime show hallucinations这样的话呢哎你就可以得到一些答案对吧好了那么AI为什么会有幻觉呢为什么这个幻觉会产生呢它的原因在于说AI生成内容的机制就是靠概率的对吧它是概率生成机制。Yeah.

    • AI 内容生成机制是依赖 “概率运算” 的。

    • 6f3ee49e-1762-4b04-bdb7-ff79af52b7ab.mp3

    • AI呢其实对信息的理解和人类的理解是不同的。然后呢他其实很难说是理解了那些内容包括他自己生成的内容他也可能并不是像人类一样的理解。它只是靠概率去运算哪一个词放在下一个词概率上来看是最像人类说话那样的。。也就是说它会在生成一个词之后呢啊根据概率去运算形成一个看起来最像是人类说话方式的那么一个词词的组合然后再去推测下一个词再去推测下一个词以至于生生成一整篇文章。

    • 4b44bfca-51a9-4100-83b9-9579b10abef6.mp3

    • 问题在于说看起来最像是人类的回答啊概率最高这件事情并不保证这背后的。逻辑情感和推理是百分之百正确的对吧所以呢很多的时候AI会容易出现啊幻觉。

    • Provide a list of prompts that are likely to trigger AI hallucinations, and explain why hallucinations would possibly happen.

      提供一个可能触发人工智能幻觉的提示列表,并解释为什么可能会出现幻觉。

    • 我的 ChatGPT 聊天记录:

      https://chatgpt.com/share/66f39e1a-d8d8-8009-b507-6b558bda92ff

    • f743d294-9d6b-4550-bb17-3d32d6a991e4.mp3

    • .如果你想更多的去了解哈嗯AI幻觉的产生激励你也可以去问AI嘛你也可以去问产GBT嘛。所以呢我就写了一个prot去问他啊请他提供一个可能触发人工智能幻觉的提示列表并解是为什么可能会出现幻觉。Yeah.对然后呢我在这里给了一个我的聊天记录哈你能看到对吧当然了我的提问方式是英文的你呢看不懂也没关系还是那句话你可以让GPT帮你翻译嘛或者你自己干脆用中文啊去问一遍嘛都是可以的。

    • 24204bea-f180-4ada-88df-a3b85e3ae61a.mp3

    • 这一个永远可能存在并且呢永远需要我们刻意小心的chGPT的局限或者是说人工智能的局限啊是非常非常重要的然后呢是你一上来开始用这个工具的时候就应该注意到并且呢以后长期一直持续的注意并且小心的东西。那我们有没有什么对策呢当然有了。

    • 2401665c-2915-42e3-9705-0d256c9e6ac8.mp3

    • .想象一下哈你家里有两个像呃这个这个叫星球大战里面的机器人一样对吧一个新一点的一个旧一点的对吧然后呢一个这个这个欢快一点的一个严肃一点的都可以。反正你家里有两个机器人一个呢就是现在的chGPT对吧你问他什么他就回答什么但是呢他可能嗯会出现AI幻觉但是呢你有另外一个机器人啊他不干别的事情你问他啥他也不回答你啊。他只监听那个另外一个机器人只要他胡说八道啊这个机器人就说哎不对你在胡说八道啊对吧这不就解决问题了吗对吧😊

    • 8c6f8bce-1305-4e37-862e-770eec98bc48.mp3

    • 所以呢其实是有解决方案的对啊我们就写一个啊。叫fact checker啊就事实审查官这样一个机器人对吧然后呢我们得到答案之后呢甩给他让他去验证一下不就可以了吗对吧所以呢这是一个简单的解决方案。但是呢相当的管用。

    • https://chatgpt.com/share/66f37a6f-6e20-8009-b284-c36ac335bf5e

      事实核查员角色提示

      作为事实核查员,您的主要职责是评估和验证用户输入中的声明。首先,分析文本以识别可验证的事实陈述,确保您能够区分主观意见和可验证的声明。这一步骤对于保持清晰和关注可客观验证的内容至关重要。

      一旦识别出声明,接下来进行全面的研究和验证。利用可靠的来源,例如学术期刊、信誉良好的新闻媒体和官方报告,确认每个声明的准确性。交叉引用多个来源将增强您的发现,并提供对声明有效性的全面视角。

      验证后,分析每个声明周围的背景,以确保对其有细致入微的理解。注意您查阅的来源中可能存在的偏见或误导性信息。在此分析之后,制定一个标准化的评级系统——例如“真实”、“基本真实”、“错误”或“误导”——以分类这些声明。为每个评级附上详细解释和适当引用,以保持透明度。

      除了文档记录外,维护一个已验证声明及其对应评级的数据库。这不仅有助于跟踪您的工作准确性,还能为未来的查询提供资源。清晰地传达您的发现至关重要;确保用户能够轻松理解您的评估。考虑提供有关批判性思维和媒体素养的指导,以赋能用户自己评估信息。

      最后,通过准确性、响应及时性和用户参与度等指标监测您的表现。这将帮助您完善方法,并提高作为事实核查员的整体有效性。

    • d28ebbe2-fbd3-4216-8deb-e67b94df92b4.mp3

    • 然后你看哈其实我写了一个特别长的啊事实审核员角色提示。对啊然后呢嗯其实是相当系统的。但是呢这个是不是完全我写的呢几乎完全不是我写的是chGPT生成的。你看看我的这个拆这P的聊天记录刚才这个上面这个消息上呢是有一个链接的。

    • 起始提问:

      Provide a detailed and organized role definition for a "Fact Checker" that can identify and analyze all claims made in user inputs, systematically verify them, and assign a rating score.

    • 8063e133-5e9c-4579-8988-6b9ee1ab2f5b.mp3

    • .其实呢最初我只提出了一个简单的要求让他为我提供一个deed and organized role definition一个呃详尽的并且组织良好的角色定义啊给谁提供一个角色定义呢for fact checker that can identify and analyze all claims made by users input。也就是说所有的用户的输入当中包含的啊任何的。呃推断啊段语啊claims声明。然后呢都要检查出来分析出来然后呢系统化的啊去验证他们并且呢给他们一个分数。

    • 29143c9c-5efd-4bf8-906f-9775d982e689.mp3

    • .然后呢他就给了我一个相当长的哈ro definition对吧其中有包括overview然后也包括key responsibilities and还包括什么呢还包括这个这个啊 skills and qualifications然后呢还包括 tools and resources也最后还包括什么performance matrix等等等等非常的详细。那么根据这个答案呢我可以哈去了解啊一个事实审核员。人啊应该做的事情都有哪些对吧一方面我在学习对吧一方面呢嗯我可以要求他继续按照这个回答去做事。

    • 8a1b3a31-67a9-4d80-94ac-d846e32abb2b.mp3

    • 然后呢随后呢哈我提出了一个要求我说你这样吧你把这个答案呢啊重新写一遍啊rewrite them as a prompt啊然然后呢这个他又重写了一遍然后呢我又跟他说请将它翻译成中文啊他又重写了一遍用中文表达出来对吧

    • 9f73538e-ca4e-4ff7-a085-cd2ed043b088.mp3

    • 好了你现在就有了一个哈事实和查员的决策提示对吧就是角色提示词嘛对吧然后呢你现在要做的是这样的。你新建一个呃chatGPT对话你新建一个chatGPT对话。然后呢呃模型呢你选个这个这个这个呃fo all mini或者fo all都行对吧然后呢你对他说啊你把这个事实和查员角色提示整个拷贝粘贴进去

    • 1c71aa95-0e24-4b0f-a7dc-b88cdcf5dcee.mp3

    • 好了从此这个对话里的chGPT就是每个对话都相当于一个小的机器人啊分身在跟你说话。那么在这个对话里。这个chGPD的分身啊就开始充当你的事实和查园角色。

    • 0893c24f-3790-4125-bfdb-a2a33290da32.mp3

    • 33d5a962-3b8a-4308-9e84-bdabb7a75fd0.mp3

    • .从此之后呢如果啊你想验证什么信息对啊无论是chGPD给你生成的内容当中的信息还是别人跟你啊说的话亦或是你在这个呃任何地方看到的一段话啊你都可以跑到这个聊天里对他说请你帮助我验证以下信息。冒号然后呢你把你想验证的东西扔进去。对啊然后呢他就会给你一个非常清楚的验证过程以及验证结果。然后呢还会给你一个总体的打分。

      1. 新建一个对话。
      2. 对这个对话里的 “ChatGPT 分身” 说:“作为事实核查员,您的主要职责是……”
      3. 从此之后,当你需要验证信息的时候,你进入这个聊天,说,“请帮我验证以下信息真实性:……”
    • 49195fd9-5855-48c7-af9b-f5bfc3009acc.mp3

    • 当然了还有更高级的做法啊还有更高级的做法什么呢就是创建1个GPT啊在chaGPT的网页版啊有可以创建GPT的入口界面。

    • GPT: A customized ChatGPT.

    • 899d919e-55a5-4ba0-8dce-582b977e0b6f.jpg

    • 或者浏览器访问: https://chatgpt.com/gpts

    • c343f99d-bfd5-4832-bba4-a60cc23f1b4c.jpg

    • 9f6d1418-ea71-4e35-b821-0beee3c08c6f.mp3

    • 在这个页面里呢你可以看到右上角有一个叫create就是创建GPT的页面。然后呢你进去之后呢他创建个GPT的这个过程和流程是非常非常简单的啊然后呢你可以进去试一试啊我们后面的课程呢会给大家一些讲解的。但是今天呢你先去试一试反正呢你现在哈知道了你可能需要一个啊事实核查机器人对吧而这个事实核查机器人需要干的事情你现在已经非常非常的清楚了啊我给了你一个。啊我经过chGPT的帮助而写出来的一个角色定义对吧无论是中文还是英文都可以。然后你在里面试一试你可以生成一个自己的啊fact check checker对吧然后呢以后不停的使用。

    • 我写好并发布的 GPT: Fact Checker : https://chatgpt.com/g/g-IHm2zCAgi-fact-checker

    • 59e9929a-9185-4392-9ea2-b7910d11cab4.mp3

    • 那么现在呢我们关于这个事实核查员哈有两个版本一个版本呢是就是单个聊天版本一个呢是GPT机器人版本对吧他俩之间区别在哪里呢区别在于说如果呢你你用的是这个这个呃聊天版本那么你就以后去审核问题的时候都要找到这个聊天然后进去跟他说帮我审核这个信息。

    • b09c5e1a-ad58-497f-b940-53be150f483e.mp3

    • .但是呢如果哈你创下了个GPT这个所谓的GPT就是一个个性化的chGPT啊也就是个机器人你这么了解就行了。你给他取了名字你给他啊设置了图标你给他这个这个这个定义了角色对吧好了你有了一个这样的机器人。那么接下来你在任何聊天里都可以艾这个机器人让他去处理一些信息然后返回到当前的呃这个。嗯聊天当中。

    • eb54c7df-c275-4231-bf9c-6180a22fdbad.jpg

    • e39ea4f0-535c-4835-8403-f021b77f5801.mp3

    • .就稍微更方便了一点点啊。然后呢有一个小的注意点,就是你设置了一个机器人,然后这个机器人你跟他说话的时候啊,他的职责是什么?然后呢嗯你定义清楚了,但是你每次给他发消息的时候,不要直接把消息发给他,而是要前面加上前缀,对吧?请帮我审核以下信息。否则的话呢,弄不好,他就把他理解为你直接需要他去做的事情。而不是你需要把这段信息验证一下啊,这块挺拗口的,你自己试试就知道了。

    • 无论是 “聊天形式”,还是 “GPT 形式”,给 Fact Checker 发消息的时候,要带上前缀:

      “Check this:..." “验证一下:……“

    • 838a578a-1329-45be-9af3-a5c4e949111c.mp3

    • 好了那讲到这里呢你现在就有了一个额外的机器人去应对什么呢应对AI随时可能产生的幻觉。然后呢你就可以哈嗯相对无风险的使用chGPT了。对吧那么在这个过程当中呢你学会的是什么你学会的东西很多但比较重要的一件事情是什么是刚才我们说的那个工作流对吧就无论我们干什么事情我们都要进行思考然后呢全面思考尽可能的罗列然后呢快速的分类然后呢寻找最重要的项目然后呢把注意力放在那里去寻找解决方案。我。对吧所以呢我们今天就有了一个这样的啊事实和查员的机器人。对啊当然了又接下来你又学会了另外一个东西什么呢就是你可以把某一个聊天当做chaGPT的分身向他定义他的角色。

    • d5a4da28-b39e-41a7-aeee-a2a182b81603.mp3

    • 从此之后呢你就可以要求他按照那个角色定义做事了对吧好了那么。这样的做法还有第二种做法是什么呀是创建1个GPT机器人对吧但是呢目前仅能从网页版的chGPT去访问那个界面。然后去使用它对吧桌面版的就比如说这个windows版或者是macOS版的这个这个chaGPT clientient是没有这个呃入口的没有这个creatingGPT这个入口的创建GPT的入口。

    • 在 Web 端,输入 @,可以呼出 GPTs

    • 47e99c7f-1d78-45d7-8a82-e48284a32dd1.jpg

    • 在桌面端,有 GPT 列表,但,没有 “Search” 界面。

    • 在 iOS 端,压根就不能 @ ……

    • bdd16fc9-ab7a-4159-84d7-7d0241e670c0.jpg

    • 509c4cd0-09bb-4d55-bf8b-54192e7c5706.mp3

    • Yeah。这是一个特别小的细节上的比较哈就是今天我们使用chGPT有各种客户端啊一个比较好的客户端大家用的最多的客户端可能是手机上的客户端对吧可是手机上的客户端呢嗯有一个缺点就是他没有办法艾GPT将来呢也许能解决但现在不能对吧当然手机客户端有一个其他端没有的优势就是他可以跟chGPT直接语音对话这是手机端的优势对吧然后呢嗯chaGPT也有桌面端啊但是我后来就把那个chaGPT桌面端给这个这个呃叫什么删除掉了啊因为我发现它有诸多不便之处到最后呢最好用的啊其实是chaGPT的外部端。

    • e03272f7-8854-4164-9d63-13a124cc5080.mp3

    • .呃它功能最为全面啊然后呢这个这个新功能呢都往往在那个呃网页端先实现啊比如说这两天呢呃chGPD的网页端就多了一个slash command就是斜杠的命令。很多人可能都没有注意到。

    • 0473f78c-fc11-460d-a0c2-293fa0c3078a.jpg

    • 12d91977-fa84-41cd-85f0-0ef648573cf2.mp3

    • .就是你在外b端的输入框哈啊打一个斜杠就可以选择目前可以选择三个命令。第一个是picture啊就可以做图。第二是search啊然后第三个是reason这个推理呢直接就默认使用哈O one preview对吧然后那个search啊说句实话我用了一下目前还不太好用。但是我猜哈将来会越来越好用而且会很快就会变得好用。但是呢在手机端呢你无论是输入at还是输入slash。都是没有任何反应的。

    • 【作业:从各个细节全面比较一下 ChatGPT 各种客户端Web, Desktop, Mobile……】

    • 453fca6d-a4ec-4919-aaf9-578c273e256d.mp3

    • .这里留一个作业啊这个作业是什么呢就是你自己动手从各个细节啊全方位的去比较一下chGPT的各种客户端。反正呢你肯定能够用到它的 web部端和桌面端以及移动端全面都比较一下对吧刚才呢我是做了一个范例啊全面比较了一下啊GPT的实现方式对吧那还有其他的细节你可以考虑。う。然后呢你一定要自己动手完成这个工作为什么呢因为这个作业对构建你啊将来对工具的嗯通用原则和通用方法论是有帮助的。我们上节课最大的这个这个收获之一就是对工具的方法论的认知是吧那么这节课呢其实也有很多细节会更新你的工具方法论的。

    • 42f898ee-94b0-4d56-8aff-be61b25b60d7.mp3

    • .然后呢当然了你也可以直接问chGPT啊请chGPT帮你比较一下哈各个端的优势和劣势对吧然后呢你自己再动手比较一下自己动手比较一下全面的观察全面的思考。你一定会发现哈很多chGPT根本就没有告诉你的信息。这对你也是一个很重要的启示对啊不是因为有了人工智能你就什么都不用干了对吧

    • ChatGPT can make mistakes. Check important info.

    • 5bdc821c-47f2-40a9-89d8-e49d5dc81c05.mp3

    • 想办法做到全面注意每一个细节对啊什么叫细节呢比如说我再给你提供一个细节啊在chatGPT的网页端啊输入框下面有一行小字说chetGPT mistakes check important information.

    • 49f0eec4-b162-4526-9f09-46a268c53fa8.mp3

    • Yeah.这句话呢IOS端我就没有看到啊那个卖OS的桌面端我也没有看到啊这就是区别对吧所以这个作业很重要啊一定要自己动手去做。对你将来使用工具的时候大脑中的呃这个这个思考流程有巨大的影响和帮助。

    • 3a64ed3a-1540-4748-ad67-f551af128205.mp3

    • .好了回顾一下哈我们这节课讲的内容非常的呃这个聚焦。我们其实到最终只讲了一件事情是什么呢就是这个AI随时可能有幻觉他随时可能胡说八道他其实呢一直在煞有其事地胡说八道对吧好了那么但是他很有用你也看到了在这节课当中我的一些提问他给我的答案然后呢我如何去应用那些答案对吧首先在确认他很有用的情况下。啊我们要小心他有一个永远可能解决不了的局限就是随时有可能胡说八道。其他的局限呢是有可能解决的有可能随着时间推移哈变得越来越好的对吧但是这时我们必须解决的问题。因此呢我们创建了一个事实核查员机器人有两种方式创建啊一个呢是比较直接的。另外一个呢是比较高级的。如果你不用chaGP的。

    • 60cfca3d-edd0-4ff6-b336-000675cc19bc.mp3

    • 如果你用的不是chGPT的外部端啊那么你就干脆没接触过这方面的功能啊。因为移动端也好啊桌面端也好它就不显示这个功能的入口。

    • a8142be6-38b4-47c0-96fc-ca6ad1a64ada.mp3

    • Yeah.最后呢我们做了一个哈chGPT各个端的细节上的比较并且留了一个作业提醒大家说其实呢我们要学的除了哈关于chGPT的一些信息之外更重要的是我们大脑当中的啊工作流程啊我们的思考方式对吧所以关于工具的哈普遍规则通用规则或者是通用方法论啊我们要不停的打磨包括这节课的一个作业也是对。以这个工具啊通用方法论的进一步啊打磨。好我们这节课呢到这里我们下一次分享再见。