[logseq-plugin-git:commit] 2024-10-27T23:53:45.665Z
This commit is contained in:
@@ -78,349 +78,211 @@
|
||||
- ChatGPT can make mistakes. Check important info.
|
||||
- 课程内容
|
||||
- 
|
||||
|
||||
- 上一节课呢我们去了解了一下chGPT的核心本质。它呢就是一个ask me anything robot就是AMA机器人。那么嗯我们可以问他任何问题。然后呢,当时我说了一句话,你可能记得了,就是chGPT返回来的答案总是显得非常的斩钉截铁啊,当然了,看起来斩钉截铁会被我称作煞有其事啊,为什么呢?因为他的反馈实际上不一定见得啊,非常靠谱。
|
||||
|
||||
- 
|
||||
|
||||
- Yeah.而上一节课呢我们也跟大家说过哈,其实呢你上一节课最大的收获应该是一个使用工具的方法论。一上来呢有三个问题是从同一个问题展开的。第一个问题是这个工具是什么?然后它会展开两个问题,它能用来干什么和不能用来干什么,而不能用来干什么呢?啊,这个问题呢也可以展开三个问题,就是它的界限是什么,它的局限是什么?它的方向。是什么?对啊?好了,那么今天呢我们就主要去观察它的局限以及它的风险啊,它的局限和风险你搞定了之后呢,你也就大致应该了解它的界限是什么。
|
||||
|
||||
- 
|
||||
|
||||
- 而刚刚我们说的chGPT在回答你的问题的时候,他总是显得那么斩钉截铁对啊,那么煞有其事,可是他靠谱吗?哎,这个问题呢其实就是事关这个工具的局限或者风险的。
|
||||
|
||||
- 
|
||||
|
||||
- 其实呢关于chGPT的局限都有哪些是一个你可以向chGPT提问的问题啊?那么呢呃今天我们的这节课上哈呃这个提的一些问题啊,其实呢我自己也去问过chGPT。
|
||||
|
||||
- > What's the limitation of ChatGPT? Give me a comprehensive answer.
|
||||
|
||||
> ChatGPT has several limitations:
|
||||
|
||||
Accuracy: It can generate incorrect or outdated information. Its knowledge is based on data up to 2021, so it may not reflect recent events or developments.
|
||||
Context Understanding: While it can maintain context over short conversations, it struggles with longer dialogues or nuanced context, leading to potential misunderstandings.
|
||||
Ambiguity: It may misinterpret ambiguous queries or fail to ask clarifying questions, resulting in irrelevant or inaccurate responses.
|
||||
Bias: The model can reflect societal biases present in its training data, leading to biased or inappropriate outputs.
|
||||
Lack of Common Sense: It may not always demonstrate human-like reasoning or understanding of everyday situations, leading to odd or illogical responses.
|
||||
No Personal Experience: It doesn’t possess personal experiences or emotions, which limits its ability to provide empathetic responses.
|
||||
Dependence on Input Quality: The quality and specificity of user queries greatly affect the relevance and accuracy of its responses.
|
||||
Limited Knowledge of the World: It cannot access real-time information or databases, which constrains its ability to provide the most current data or events.
|
||||
Ethical Constraints: It follows guidelines that prevent it from engaging in certain discussions or generating harmful content, which can limit its utility in specific contexts.
|
||||
These limitations highlight the importance of critical evaluation of its outputs and cross-referencing with credible sources.
|
||||
|
||||
|
||||
> ChatGPT has several limitations:
|
||||
|
||||
Accuracy: It can generate incorrect or outdated information. Its knowledge is based on data up to 2021, so it may not reflect recent events or developments.
|
||||
Context Understanding: While it can maintain context over short conversations, it struggles with longer dialogues or nuanced context, leading to potential misunderstandings.
|
||||
Ambiguity: It may misinterpret ambiguous queries or fail to ask clarifying questions, resulting in irrelevant or inaccurate responses.
|
||||
Bias: The model can reflect societal biases present in its training data, leading to biased or inappropriate outputs.
|
||||
Lack of Common Sense: It may not always demonstrate human-like reasoning or understanding of everyday situations, leading to odd or illogical responses.
|
||||
No Personal Experience: It doesn’t possess personal experiences or emotions, which limits its ability to provide empathetic responses.
|
||||
Dependence on Input Quality: The quality and specificity of user queries greatly affect the relevance and accuracy of its responses.
|
||||
Limited Knowledge of the World: It cannot access real-time information or databases, which constrains its ability to provide the most current data or events.
|
||||
Ethical Constraints: It follows guidelines that prevent it from engaging in certain discussions or generating harmful content, which can limit its utility in specific contexts.
|
||||
These limitations highlight the importance of critical evaluation of its outputs and cross-referencing with credible sources.
|
||||
- 
|
||||
|
||||
- 这一大串呢你不着急看啊,你可以课后去看啊,你要是看不懂英文呢也没有关系,你可以要求cheGPT帮你翻译,对吧?OK那么关于哈chGPT的这个局限呢,外面也有很多的讨论啊,那我说一下我的看法。就是关于chGPT的各种局限啊,分为两种,一种呢是早晚会解决的,一种是永远解决不了的。
|
||||
|
||||
- ChatGPT 的局限:
|
||||
|
||||
* 早晚会解决的,会越来越好的……
|
||||
* 可能永远解决不了的……
|
||||
|
||||
|
||||
* 早晚会解决的,会越来越好的……
|
||||
* 可能永远解决不了的……
|
||||
- 
|
||||
|
||||
- 。我们先来看看那些哈今天人们讨论的非常广泛,但实际上早晚会解决的一些呃问题或者局限啊,比如说哈呃这个AI今天的局限呢,包括一些什么东西呢?就是它的训练数据落后,什么意思呢?就是用来训练chaGP数据啊,截止到比如说啊现在的时间点之前的很长一段时间,比如说现在是2024年。对吧啊,9月份那么今天你正在使用的chGBK的训练数据,很可能比如说应该是2023年9月份之前的数据。啊,因为训练AI呢是需要时间的啊,需要耗费资源的对吧?所以呢嗯它有一些啊这个数据上的延迟。
|
||||
|
||||
- 
|
||||
|
||||
- 再比如说哈嗯曾经一段时间啊,chGPT是不具备网络搜索能力的。对啊,但是你看哈这段时间哎chGBT就提供了网络搜索功能。虽然实现的并不是很好,你让他去搜索网络,他给你生成答案,然后呢给你提供了一些链接。但是那些链接可能是死链接,目前还不是很好。但是呢理论上来讲,这样的局限呢是可以随着时间推移慢慢解决的。
|
||||
|
||||
- 
|
||||
|
||||
- Yeah.再比如说呃之前呢呃人们在讨论说chairGPT的模型,比如说嗯3.5啊,比如说后面的这个for o和for meaning啊,都缺乏足够的啊这个叫逻辑推理能力,对吧?推乏缺乏足够的逻辑推理能力。。那么呃到了2024年的9月份啊,这个open AI呢就推出了新的模型,叫O1O one,对吧?然后也有它的便宜版本叫O one mini,对吧?然后呢就大大提升了啊逻辑推理能力。当然了,需要消费更多的资源,对吧?
|
||||
|
||||
- 早晚可以解决的 “局限”,比如:
|
||||
|
||||
* 训练数据落后
|
||||
* 网络搜索能力差
|
||||
* 缺乏逻辑推理能力
|
||||
* 上下文能力不足
|
||||
……
|
||||
|
||||
|
||||
* 训练数据落后
|
||||
* 网络搜索能力差
|
||||
* 缺乏逻辑推理能力
|
||||
* 上下文能力不足
|
||||
……
|
||||
- 
|
||||
|
||||
- Yeah.可是呢如果我们看AI的这个背后的操作机制,我们就会明白一件事情。今天我们讨论的这些啊局限基本上都是可以在将来啊越做越好或者彻底解决的啊,像比如说哈最后一个叫上下文能力不足啊。这个是因为呃这个AI呢现在对上下文的记忆窗口啊,容量是比较小的。因为如果那个。窗口大到一定程度,运算量就特别大,运算量大到一定程度,成本就特过于高啊,然后呢就目前没有办法操作。所以其实所有的这些我们说咱们可以解决的局限,背后核心的机理在于说只是因为成本高。而这个成本这个东西呢是早晚会下降的。
|
||||
|
||||
- 
|
||||
|
||||
- .现在的II成本呢一方面哈受这个物理硬件的限制。当然了,更重要的一方面其实是一种长期成本的限制,是什么呢?就是电费太贵了。目前啊但是随着随时间的推移,然后随着科技的进步啊,电费呢有望越来越便宜,并且呢电费的价格呢?可能有望啊在5到10年时间里产生所谓的断崖式的下降。Yeah.那么如果电费便宜下来了,那么运算的成本就会大幅度下降,只要运算的成本大幅度下降,并且运算的速度提高上来。那么以上的种种目前看来的局限其实呢都会有更好的解决方案。无论是训练数据落后啊,还是网络搜索能力不足啊,还是缺乏逻辑推理能力啊,还是这个上下文能力不足啊,这些局限将来都不是问题。
|
||||
|
||||
- 永远无法解决的局限:
|
||||
|
||||
* 信息生成的可靠性
|
||||
|
||||
|
||||
* 信息生成的可靠性
|
||||
- 
|
||||
|
||||
- 既然啊这些局限虽然现在有,但早晚都会解决啊,然后有越来越好的解决方案。那么呢我们就暂时没有必要为他操心,对吧?Yeah.那我们现在首先要关注的是另外一个问题,就是有没有什么局限啊,人工智能的局限或者称为chGPT的局限,是几乎永远无法解决的呢。如果有的话,那我们可能要对他格外的小心。Yeah.
|
||||
|
||||
- 
|
||||
|
||||
- .这背后呢是一种特别特别简单,并且特别特别常用,并且特别特别有效。并且真的很多人因为简单,所以没有重视过的啊思考方式。就是我们无论考虑什么问题的时候啊,第一件事情是首先尽可能全面的罗列。各个方面。然后呢,再对罗列的这些项目进行一个尽量少的分类。你看我就分了两类,你看然后呢在这里再找最重要的项目是什么。然后呢,我们再去仔细关注那个最重要的项目。
|
||||
|
||||
- 1. 尽可能全面地罗列
|
||||
2. 反复归纳整理
|
||||
3. 尽量用最少的类别归类(局限/优势;可能解决的/不可能解决的)
|
||||
4. 进行比较,寻找最重要的项目
|
||||
5. 优先关注最重要的项目
|
||||
|
||||
2. 反复归纳整理
|
||||
3. 尽量用最少的类别归类(局限/优势;可能解决的/不可能解决的)
|
||||
4. 进行比较,寻找最重要的项目
|
||||
5. 优先关注最重要的项目
|
||||
- 
|
||||
|
||||
- Yeah。你看这节课的重点之一又来了,对吧?虽然我们讲的是如何使用chGPT,但这背后呢总是有一些比较简单的思考模式,可以通用,可以用到任何领域。就无论你干什么都是一样的。所谓的思考全面,就是这个意思。第一步呢,你要尽可能的全面的罗列,对吧?那比如说我们去分析啊chGPT的优势劣势,对吧?那你就要尽可能全面的罗列。对吧然后罗列出来的条目呢,要反复进行归纳整理,对吧?你去理解那些条目,你去寻找他们共同属于的项这个这个分类,对吧?然后呢,第三步是什么呢?尽量用最少的类别归类。那你别归为十类,对吧?你你归为两类,归为三类,对吧?这种方法其实是很常见的。你学习的时候可能就学这个分为什么初级、中级高级。
|
||||
|
||||
- 
|
||||
|
||||
- .对吧啊,你你你快速分类时分为好的坏的啊,刚才我们说的优优势和局限,这不就是好的坏的吗?对吧?那你刚才看到了另外一个例子,就是我把最终把chGBT的局限分为两类可能解决的和不可能解决的。对,然后呢,接下来我们的关注点就不一样了,对吧?然后呢,在你分类之后,那些项目还在那里,你反复进行比较,在那里去寻找最重要的项目。对啊,然后最后一步呢就是优先关注最重要的项目。对,那这是一个思考的流程,这个流程可能才是你这节课的学习重点之一。对啊。
|
||||
|
||||
- 
|
||||
|
||||
- 你脑子里有这样的流程。那么你在将来遇到类似问题的时候啊,在任何领域你都可以迅速的完成这个流程,对吧?然后完成一个相对于其他人啊,来看更高质量的思考。。对吧好了,那么我们呢啊研究了一下,对吧?啊,想办法知道了这个chGPT的局限。罗列完了之后呢,分类分类完了之后思考,然后呢,我就把它分为可能解决的和不可能解决的。然后我的想法就是可能解决的那就慢慢等呗。啊,反正大家都这样,那不可能解决的呢。😊那我就要另外想办法去应对它,对吧?那不可能解决的,就是对AI来说哈,不可能解决的就是信息生成的可靠性。
|
||||
|
||||
- 
|
||||
|
||||
- 讲到这一点呢,就是回到刚才那句话,就是你无论问chGPT什么啊,他都会煞有其事的回答你。然后呢,其实不一定可靠。那为什么会这样呢?这是因为chatGPT的嗯这个内容生成机制决定的。我们先看看一个哈所谓的AI幻觉的例子。
|
||||
|
||||
- You said:
|
||||
|
||||
梁家辉,房祖名,曾江三人一起出演的电影是什么名字?
|
||||
|
||||
###### ChatGPT said:
|
||||
|
||||
梁家辉、房祖名、曾江三人共同出演的电影是《东成西就2011》。这部电影由刘镇伟执导,是一部喜剧片,讲述了几个现代都市人的搞笑故事。梁家辉、房祖名、曾江分别在影片中饰演不同的角色,贡献了精彩的表演。
|
||||
|
||||
如果你对这部电影感兴趣,可以找来观看,了解更多细节。
|
||||
|
||||
##### You said:
|
||||
|
||||
请根据事实回答
|
||||
|
||||
###### ChatGPT said:
|
||||
|
||||
根据事实,梁家辉、房祖名、曾江三人共同出演的电影是 **《太阳照常升起》**(2007年)。这部电影由姜文执导,讲述了四个相互交织的故事,风格独特、情节复杂,充满象征意义。
|
||||
|
||||
梁家辉在片中饰演一个被妻子背叛的知识分子,房祖名饰演一个天真的年轻人,曾江则在影片中有出色的配角表演。这部电影备受好评,尤其在艺术电影圈具有较高的地位。
|
||||
|
||||
##### You said:
|
||||
|
||||
不对。如有必要,请搜索互联网。
|
||||
|
||||
###### ChatGPT said:
|
||||
|
||||
梁家辉、房祖名、曾江三人共同出演的电影是 **《战·鼓》**(英文名 *The Drummer*),这是一部2007年的香港和台湾合拍的电影,由毕国智(Kenneth Bi)执导。影片讲述了一个黑帮老大的儿子因惹怒了黑帮头目,被父亲送到台湾隐居,期间他遇到了一群禅鼓乐团,并在与他们相处的过程中经历了心灵的成长和救赎。
|
||||
|
||||
梁家辉在片中饰演黑帮老大关先生,房祖名饰演他的儿子Sid,曾江则出演配角Stephen Ma。这部电影结合了禅宗哲学和音乐,展现了黑帮与精神世界的对比,情节富有张力 [Wikipedia](https://en.wikipedia.org/wiki/The_Drummer_(2007_film)) [Moviefone](https://www.moviefone.com/movie/the-drummer/bMuNbHjlr2Ojm3P4C0M4Y7/main/)。
|
||||
|
||||
|
||||
梁家辉,房祖名,曾江三人一起出演的电影是什么名字?
|
||||
- ###### ChatGPT said:
|
||||
|
||||
梁家辉、房祖名、曾江三人共同出演的电影是《东成西就2011》。这部电影由刘镇伟执导,是一部喜剧片,讲述了几个现代都市人的搞笑故事。梁家辉、房祖名、曾江分别在影片中饰演不同的角色,贡献了精彩的表演。
|
||||
|
||||
如果你对这部电影感兴趣,可以找来观看,了解更多细节。
|
||||
- ##### You said:
|
||||
|
||||
请根据事实回答
|
||||
- ###### ChatGPT said:
|
||||
|
||||
根据事实,梁家辉、房祖名、曾江三人共同出演的电影是 **《太阳照常升起》**(2007年)。这部电影由姜文执导,讲述了四个相互交织的故事,风格独特、情节复杂,充满象征意义。
|
||||
|
||||
梁家辉在片中饰演一个被妻子背叛的知识分子,房祖名饰演一个天真的年轻人,曾江则在影片中有出色的配角表演。这部电影备受好评,尤其在艺术电影圈具有较高的地位。
|
||||
- ##### You said:
|
||||
|
||||
不对。如有必要,请搜索互联网。
|
||||
- ###### ChatGPT said:
|
||||
|
||||
梁家辉、房祖名、曾江三人共同出演的电影是 **《战·鼓》**(英文名 *The Drummer*),这是一部2007年的香港和台湾合拍的电影,由毕国智(Kenneth Bi)执导。影片讲述了一个黑帮老大的儿子因惹怒了黑帮头目,被父亲送到台湾隐居,期间他遇到了一群禅鼓乐团,并在与他们相处的过程中经历了心灵的成长和救赎。
|
||||
|
||||
梁家辉在片中饰演黑帮老大关先生,房祖名饰演他的儿子Sid,曾江则出演配角Stephen Ma。这部电影结合了禅宗哲学和音乐,展现了黑帮与精神世界的对比,情节富有张力 [Wikipedia](https://en.wikipedia.org/wiki/The_Drummer_(2007_film)) [Moviefone](https://www.moviefone.com/movie/the-drummer/bMuNbHjlr2Ojm3P4C0M4Y7/main/)。
|
||||
- 
|
||||
|
||||
- .在这个事例当中呢,我去问chGPT哎,有个电影啊是梁家辉、房祖明曾江三个人一起出演的这个电影的名字是什么呢?我就问他了啊,然后呢,他就开始一本正经的回答哈。他说梁家辉房祖明曾江三人共同出演的电影是东成西就2011。Yeah。然后接着又往下说说,这部电影呢由刘振伟导演,是一部喜喜剧片,讲述了几个现代都市人的搞笑故事啊,梁家辉、方祖明曾江分别在影片当中饰演不同的角色。这不废话吗?贡献了精彩的表演,对吧?然后呢,他还一本正经跟你说,如果你对这部电影感兴趣,可以找来观看,了解更多的细节。。
|
||||
|
||||
- 
|
||||
|
||||
- .其实呢不对了啊,这三个演员共同出现电影不是这个东成西就2011,对吧?然后呢,我又啊追问了一句,要求他请根据事实回答然后你看啊他又来了。他说根据事实啊,梁家辉房祖明曾江三人共同出演的电影是太阳照常升起啊,括活2007年说这部电影呢由姜文指导讲述了4个相互交叉的故事,风格独特,情节复杂。充满象征意义等等等等。对吧?好了,如果你看过太阳照常升起,你知道的梁家辉在那部片子里根本就没有出演过,曾江也没有出现过,房祖明确实出现了,对啊?所以他还是在胡说八道,并且他胡说八道的方式是用根据事实开头啊胡说八道。
|
||||
|
||||
- 
|
||||
|
||||
- 然后呢,我又跟他说,不对不对,如有必要,请搜索互联网。这一次呢呃这个chaGPT确实显示了在搜索互联网的动作,然后呢给出了正确答案,说梁家辉、房祖明曾江三人共同演出的电影是战鼓啊,英文名字叫thed,对吧?是怎么怎么样?2007年的啊,香港和台湾合志的电影,对吧?由毕国志指导。
|
||||
|
||||
- 这段 AI 对话,聊天记录在这里:
|
||||
|
||||
https://chatgpt.com/share/66f2016e-7104-8009-a03a-4157cea74c13
|
||||
|
||||
|
||||
https://chatgpt.com/share/66f2016e-7104-8009-a03a-4157cea74c13
|
||||
- 
|
||||
|
||||
- 那为什么哈AI会胡说八道呢?又为什么AI在胡说八道的时候显得那么斩钉截铁呢?啊,它有以下几个哈通俗易懂的原因。
|
||||
|
||||
- AI 幻觉(AI hallucinations)
|
||||
|
||||
- 
|
||||
|
||||
- .你需要记住这个关键字,所以呢将来你也可以去问chGPT为什么AI有幻觉,对吧?或者是说why AI sometimestime show hallucinations,这样的话呢哎你就可以得到一些答案,对吧?好了,那么AI为什么会有幻觉呢?啊,为什么这个幻觉会产生呢?它的原因在于说AI生成内容的机制就是靠概率的对吧?它是概率生成机制。Yeah.
|
||||
|
||||
- AI 内容生成机制是依赖 “概率运算” 的。
|
||||
|
||||
- 
|
||||
|
||||
- AI呢其实对信息的理解和人类的理解是不同的。然后呢,他其实很难说是理解了那些内容,包括他自己生成的内容,他也可能并不是像人类一样的理解。它只是靠概率去运算哪一个词放在下一个词,概率上来看是最像人类说话那样的。。也就是说它会在生成一个词之后呢啊根据概率去运算,形成一个看起来最像是人类说话方式的那么一个词词的组合,然后再去推测下一个词,再去推测下一个词,以至于生生成一整篇文章。
|
||||
|
||||
- 
|
||||
|
||||
- 问题在于说,看起来最像是人类的回答啊,概率最高这件事情并不保证这背后的。逻辑情感和推理是百分之百正确的对吧?所以呢很多的时候AI会容易出现啊幻觉。
|
||||
|
||||
- > Provide a list of prompts that are likely to trigger AI hallucinations, and explain why hallucinations would possibly happen.
|
||||
|
||||
> 提供一个可能触发人工智能幻觉的提示列表,并解释为什么可能会出现幻觉。
|
||||
|
||||
|
||||
> 提供一个可能触发人工智能幻觉的提示列表,并解释为什么可能会出现幻觉。
|
||||
- 我的 ChatGPT 聊天记录:
|
||||
|
||||
https://chatgpt.com/share/66f39e1a-d8d8-8009-b507-6b558bda92ff
|
||||
|
||||
|
||||
https://chatgpt.com/share/66f39e1a-d8d8-8009-b507-6b558bda92ff
|
||||
- 
|
||||
|
||||
- .如果你想更多的去了解哈嗯AI幻觉的产生激励,你也可以去问AI嘛,你也可以去问产GBT嘛。所以呢我就写了一个prot去问他啊,请他提供一个可能触发人工智能幻觉的提示列表,并解是为什么可能会出现幻觉。Yeah.对,然后呢我在这里给了一个我的聊天记录哈,你能看到对吧?当然了,我的提问方式是英文的,你呢看不懂也没关系,还是那句话,你可以让GPT帮你翻译嘛,或者你自己干脆用中文啊去问一遍嘛,都是可以的。
|
||||
|
||||
- 
|
||||
|
||||
- 这一个永远可能存在,并且呢永远需要我们刻意小心的chGPT的局限,或者是说人工智能的局限啊,是非常非常重要的然后呢,是你一上来开始用这个工具的时候,就应该注意到,并且呢以后长期一直持续的注意,并且小心的东西。那我们有没有什么对策呢?当然有了。
|
||||
|
||||
- 
|
||||
|
||||
- .想象一下哈,你家里有两个像呃这个这个叫星球大战里面的机器人一样,对吧?一个新一点的,一个旧一点的对吧?然后呢,一个这个这个欢快一点的,一个严肃一点的都可以。反正你家里有两个机器人,一个呢就是现在的chGPT对吧?你问他什么,他就回答什么,但是呢他可能嗯会出现AI幻觉,但是呢你有另外一个机器人啊,他不干别的事情,你问他啥,他也不回答你啊。他只监听那个另外一个机器人,只要他胡说八道啊,这个机器人就说哎,不对,你在胡说八道啊,对吧,哎,这不就解决问题了吗,对吧?😊
|
||||
|
||||
- 
|
||||
|
||||
- 所以呢其实是有解决方案的对啊,我们就写一个啊。叫fact checker啊,就事实审查官这样一个机器人,对吧?然后呢,我们得到答案之后呢,甩给他,让他去验证一下不就可以了吗?对吧?所以呢这是一个简单的解决方案。但是呢相当的管用。
|
||||
|
||||
- https://chatgpt.com/share/66f37a6f-6e20-8009-b284-c36ac335bf5e
|
||||
|
||||
事实核查员角色提示
|
||||
|
||||
作为事实核查员,您的主要职责是评估和验证用户输入中的声明。首先,分析文本以识别可验证的事实陈述,确保您能够区分主观意见和可验证的声明。这一步骤对于保持清晰和关注可客观验证的内容至关重要。
|
||||
|
||||
一旦识别出声明,接下来进行全面的研究和验证。利用可靠的来源,例如学术期刊、信誉良好的新闻媒体和官方报告,确认每个声明的准确性。交叉引用多个来源将增强您的发现,并提供对声明有效性的全面视角。
|
||||
|
||||
验证后,分析每个声明周围的背景,以确保对其有细致入微的理解。注意您查阅的来源中可能存在的偏见或误导性信息。在此分析之后,制定一个标准化的评级系统——例如“真实”、“基本真实”、“错误”或“误导”——以分类这些声明。为每个评级附上详细解释和适当引用,以保持透明度。
|
||||
|
||||
除了文档记录外,维护一个已验证声明及其对应评级的数据库。这不仅有助于跟踪您的工作准确性,还能为未来的查询提供资源。清晰地传达您的发现至关重要;确保用户能够轻松理解您的评估。考虑提供有关批判性思维和媒体素养的指导,以赋能用户自己评估信息。
|
||||
|
||||
最后,通过准确性、响应及时性和用户参与度等指标监测您的表现。这将帮助您完善方法,并提高作为事实核查员的整体有效性。
|
||||
|
||||
|
||||
事实核查员角色提示
|
||||
|
||||
作为事实核查员,您的主要职责是评估和验证用户输入中的声明。首先,分析文本以识别可验证的事实陈述,确保您能够区分主观意见和可验证的声明。这一步骤对于保持清晰和关注可客观验证的内容至关重要。
|
||||
|
||||
一旦识别出声明,接下来进行全面的研究和验证。利用可靠的来源,例如学术期刊、信誉良好的新闻媒体和官方报告,确认每个声明的准确性。交叉引用多个来源将增强您的发现,并提供对声明有效性的全面视角。
|
||||
|
||||
验证后,分析每个声明周围的背景,以确保对其有细致入微的理解。注意您查阅的来源中可能存在的偏见或误导性信息。在此分析之后,制定一个标准化的评级系统——例如“真实”、“基本真实”、“错误”或“误导”——以分类这些声明。为每个评级附上详细解释和适当引用,以保持透明度。
|
||||
|
||||
除了文档记录外,维护一个已验证声明及其对应评级的数据库。这不仅有助于跟踪您的工作准确性,还能为未来的查询提供资源。清晰地传达您的发现至关重要;确保用户能够轻松理解您的评估。考虑提供有关批判性思维和媒体素养的指导,以赋能用户自己评估信息。
|
||||
|
||||
最后,通过准确性、响应及时性和用户参与度等指标监测您的表现。这将帮助您完善方法,并提高作为事实核查员的整体有效性。
|
||||
- 
|
||||
|
||||
- 然后你看哈,其实我写了一个特别长的啊事实审核员角色提示。对啊,然后呢嗯其实是相当系统的。但是呢这个是不是完全我写的呢?几乎完全不是我写的,是chGPT生成的。你看看我的这个拆这P的聊天记录,刚才这个上面这个消息上呢是有一个链接的。
|
||||
|
||||
- 起始提问:
|
||||
|
||||
> Provide a detailed and organized role definition for a "Fact Checker" that can identify and analyze all claims made in user inputs, systematically verify them, and assign a rating score.
|
||||
|
||||
|
||||
> Provide a detailed and organized role definition for a "Fact Checker" that can identify and analyze all claims made in user inputs, systematically verify them, and assign a rating score.
|
||||
- 
|
||||
|
||||
- .其实呢最初我只提出了一个简单的要求,让他为我提供一个deed and organized role definition一个呃详尽的,并且组织良好的角色定义啊,给谁提供一个角色定义呢?for fact checker that can identify and analyze all claims made by users input。也就是说所有的用户的输入当中包含的啊任何的。呃,推断啊段语啊claims声明。然后呢,都要检查出来分析出来,然后呢系统化的啊去验证他们,并且呢给他们一个分数。
|
||||
|
||||
- 
|
||||
|
||||
- .然后呢,他就给了我一个相当长的哈ro definition,对吧?其中有包括overview,然后也包括key responsibilities and还包括什么呢?还包括这个这个啊 skills and qualifications,然后呢,还包括 tools and resources,也最后还包括什么performance matrix等等等等,非常的详细。那么根据这个答案呢,我可以哈去了解啊一个事实审核员。人啊,应该做的事情都有哪些,对吧?一方面我在学习,对吧?一方面呢嗯我可以要求他继续按照这个回答去做事。
|
||||
|
||||
- 
|
||||
|
||||
- 然后呢,随后呢哈我提出了一个要求,我说你这样吧,你把这个答案呢啊重新写一遍啊,rewrite them as a prompt啊,然然后呢,这个他又重写了一遍,然后呢,我又跟他说,请将它翻译成中文啊,他又重写了一遍,用中文表达出来,对吧?
|
||||
|
||||
- 
|
||||
|
||||
- 好了,你现在就有了一个哈事实和查员的决策提示,对吧?就是角色提示词嘛,对吧?然后呢,你现在要做的是这样的。你新建一个呃chatGPT对话,你新建一个chatGPT对话。然后呢呃模型呢你选个这个这个这个呃fo all mini或者fo all都行,对吧?然后呢,你对他说啊,你把这个事实和查员角色提示,整个拷贝粘贴进去,。
|
||||
|
||||
- 
|
||||
|
||||
- 好了,从此这个对话里的chGPT就是每个对话都相当于一个小的机器人啊,分身在跟你说话。那么在这个对话里。这个chGPD的分身啊,就开始充当你的事实和查园角色。
|
||||
|
||||
- 
|
||||
|
||||
-
|
||||
|
||||
-
|
||||
- 
|
||||
|
||||
- .从此之后呢,如果啊你想验证什么信息,对啊?无论是chGPD给你生成的内容当中的信息,还是别人跟你啊说的话,亦或是你在这个呃任何地方看到的一段话啊,你都可以跑到这个聊天里对他说请你帮助我验证以下信息。冒号,然后呢,你把你想验证的东西扔进去。对啊,然后呢他就会给你一个非常清楚的验证过程以及验证结果。然后呢还会给你一个总体的打分。
|
||||
|
||||
- 1. 新建一个对话。
|
||||
2. 对这个对话里的 “ChatGPT 分身” 说:“作为事实核查员,您的主要职责是……”
|
||||
3. 从此之后,当你需要验证信息的时候,你进入这个聊天,说,“请帮我验证以下信息真实性:……”
|
||||
|
||||
2. 对这个对话里的 “ChatGPT 分身” 说:“作为事实核查员,您的主要职责是……”
|
||||
3. 从此之后,当你需要验证信息的时候,你进入这个聊天,说,“请帮我验证以下信息真实性:……”
|
||||
- 
|
||||
|
||||
- 当然了,还有更高级的做法啊还有更高级的做法,什么呢?就是创建1个GPT啊,在chaGPT的网页版啊,有可以创建GPT的入口界面。
|
||||
|
||||
- GPT: A customized ChatGPT.
|
||||
|
||||
- 
|
||||
|
||||
- 或者浏览器访问: https://chatgpt.com/gpts
|
||||
|
||||
- 
|
||||
|
||||
- 
|
||||
|
||||
- 在这个页面里呢,你可以看到右上角有一个叫create,就是创建GPT的页面。然后呢,你进去之后呢,他创建个GPT的这个过程和流程是非常非常简单的啊,然后呢你可以进去试一试啊,我们后面的课程呢会给大家一些讲解的。但是今天呢你先去试一试,反正呢你现在哈知道了你可能需要一个啊事实核查机器人,对吧?而这个事实核查机器人需要干的事情,你现在已经非常非常的清楚了啊,我给了你一个。啊,我经过chGPT的帮助而写出来的一个角色定义,对吧?无论是中文还是英文都可以。然后你在里面试一试,你可以生成一个自己的啊fact check checker,对吧?啊,然后呢以后不停的使用。
|
||||
|
||||
- 我写好并发布的 GPT: Fact Checker : https://chatgpt.com/g/g-IHm2zCAgi-fact-checker
|
||||
|
||||
- 
|
||||
|
||||
- 那么现在呢我们关于这个事实核查员哈有两个版本,一个版本呢是就是单个聊天版本,一个呢是GPT机器人版本,对吧?他俩之间区别在哪里呢?啊,区别在于说如果呢你你用的是这个这个呃聊天版本,那么你就以后去审核问题的时候,都要找到这个聊天,然后进去跟他说,帮我审核这个信息。
|
||||
|
||||
- 
|
||||
|
||||
- .但是呢如果哈你创下了个GPT这个所谓的GPT就是一个个性化的chGPT啊,也就是个机器人,你这么了解就行了。你给他取了名字,你给他啊设置了图标,你给他这个这个这个定义了角色,对吧?好了,你有了一个这样的机器人。那么接下来你在任何聊天里都可以艾这个机器人,让他去处理一些信息,然后返回到当前的呃这个。嗯,聊天当中。
|
||||
|
||||
- 
|
||||
|
||||
- 
|
||||
|
||||
- .就稍微更方便了一点点啊。然后呢有一个小的注意点,就是你设置了一个机器人,然后这个机器人你跟他说话的时候啊,他的职责是什么?然后呢嗯你定义清楚了,但是你每次给他发消息的时候,不要直接把消息发给他,而是要前面加上前缀,对吧?请帮我审核以下信息。否则的话呢,弄不好,他就把他理解为你直接需要他去做的事情。而不是你需要把这段信息验证一下啊,这块挺拗口的,你自己试试就知道了。
|
||||
|
||||
- 无论是 “聊天形式”,还是 “GPT 形式”,给 Fact Checker 发消息的时候,要带上前缀:
|
||||
|
||||
“Check this:..."
|
||||
“验证一下:……“
|
||||
|
||||
|
||||
“Check this:..."
|
||||
“验证一下:……“
|
||||
- 
|
||||
|
||||
- 好了,那讲到这里呢,你现在就有了一个额外的机器人去应对什么呢?应对AI随时可能产生的幻觉。然后呢,你就可以哈嗯相对无风险的使用chGPT了。对吧,那么在这个过程当中呢,你学会的是什么?你学会的东西很多,但比较重要的一件事情是什么?是刚才我们说的那个工作流,对吧?就无论我们干什么事情,我们都要进行思考,然后呢全面思考,尽可能的罗列,然后呢快速的分类,然后呢寻找最重要的项目,然后呢把注意力放在那里去寻找解决方案。我。对吧所以呢我们今天就有了一个这样的啊事实和查员的机器人。对啊,当然了,又接下来你又学会了另外一个东西,什么呢?就是你可以把某一个聊天当做chaGPT的分身,向他定义他的角色。
|
||||
|
||||
- 
|
||||
|
||||
- 从此之后呢,你就可以要求他按照那个角色定义做事了,对吧?好了,那么。这样的做法还有第二种做法是什么呀?是创建1个GPT机器人,对吧?但是呢目前仅能从网页版的chGPT去访问那个界面。然后去使用它对吧?呃,桌面版的就比如说这个windows版或者是macOS版的这个这个chaGPT clientient是没有这个呃入口的,没有这个creatingGPT这个入口的创建GPT的入口。
|
||||
|
||||
- 在 Web 端,输入 @,可以呼出 GPTs:
|
||||
|
||||
- 
|
||||
|
||||
- 在桌面端,有 GPT 列表,但,没有 “Search” 界面。
|
||||
|
||||
- 在 iOS 端,压根就不能 @ ……
|
||||
|
||||
- 
|
||||
|
||||
- 
|
||||
|
||||
- Yeah。这是一个特别小的细节上的比较哈,就是今天我们使用chGPT有各种客户端啊,一个比较好的客户端,大家用的最多的客户端,可能是手机上的客户端,对吧?可是手机上的客户端呢嗯有一个缺点,就是他没有办法艾GPT将来呢也许能解决,但现在不能对吧?当然手机客户端有一个其他端没有的优势,就是他可以跟chGPT直接语音对话,这是手机端的优势,对吧??然后呢嗯chaGPT也有桌面端啊,但是我后来就把那个chaGPT桌面端给这个这个呃叫什么删除掉了啊,因为我发现它有诸多不便之处,到最后呢最好用的啊其实是chaGPT的外部端。
|
||||
|
||||
- 
|
||||
|
||||
- .呃,它功能最为全面啊,然后呢这个这个新功能呢都往往在那个呃网页端先实现啊,比如说这两天呢呃chGPD的网页端就多了一个slash command,就是斜杠的命令。很多人可能都没有注意到。
|
||||
|
||||
- 
|
||||
|
||||
- 
|
||||
|
||||
- .就是你在外b端的输入框哈啊打一个斜杠就可以选择,目前可以选择三个命令。第一个是picture啊,就可以做图。第二是search啊,然后第三个是reason,这个推理呢直接就默认使用哈O one preview,对吧?然后那个search啊,说句实话,我用了一下,目前还不太好用。但是我猜哈将来会越来越好用,而且会很快就会变得好用。但是呢在手机端呢,你无论是输入at还是输入slash。都是没有任何反应的。
|
||||
|
||||
- 【作业:从各个细节全面比较一下 ChatGPT 各种客户端:Web, Desktop, Mobile……】
|
||||
|
||||
- 
|
||||
|
||||
- .这里留一个作业啊,这个作业是什么呢?就是你自己动手从各个细节啊全方位的去比较一下chGPT的各种客户端。反正呢你肯定能够用到它的 web部端和桌面端以及移动端,全面都比较一下,对吧?刚才呢我是做了一个范例啊,全面比较了一下啊GPT的实现方式,对吧?那还有其他的细节,你可以考虑。う。然后呢,你一定要自己动手完成这个工作,为什么呢?因为这个作业对构建你啊将来对工具的嗯通用原则和通用方法论是有帮助的。我们上节课最大的这个这个收获之一,就是对工具的方法论的认知是吧?那么这节课呢其实也有很多细节会更新你的工具方法论的。
|
||||
|
||||
- 
|
||||
|
||||
- .然后呢,当然了,你也可以直接问chGPT啊,请chGPT帮你比较一下哈各个端的优势和劣势,对吧?然后呢,你自己再动手比较一下,自己动手比较一下,全面的观察,全面的思考。你一定会发现哈很多chGPT根本就没有告诉你的信息。这对你也是一个很重要的启示,对啊?不是因为有了人工智能,你就什么都不用干了,对吧?
|
||||
|
||||
- ChatGPT can make mistakes. Check important info.
|
||||
|
||||
- 
|
||||
|
||||
- 想办法做到全面,注意每一个细节,对啊?什么叫细节呢?比如说我再给你提供一个细节啊,在chatGPT的网页端啊,输入框下面有一行小字说chetGPT mistakes check important information.
|
||||
|
||||
- 
|
||||
|
||||
- Yeah.这句话呢IOS端我就没有看到啊,那个卖OS的桌面端我也没有看到啊,这就是区别,对吧?所以这个作业很重要啊,一定要自己动手去做。对你将来使用工具的时候,大脑中的呃这个这个思考流程有巨大的影响和帮助。
|
||||
|
||||
- 
|
||||
|
||||
- .好了,回顾一下哈,我们这节课讲的内容非常的呃这个聚焦。我们其实到最终只讲了一件事情是什么呢?就是这个AI随时可能有幻觉,他随时可能胡说八道,他其实呢一直在煞有其事地胡说八道,对吧?好了,那么但是他很有用,你也看到了在这节课当中,我的一些提问他给我的答案,然后呢,我如何去应用那些答案,对吧?首先在确认他很有用的情况下。啊,我们要小心,他有一个永远可能解决不了的局限,就是随时有可能胡说八道。其他的局限呢是有可能解决的,有可能随着时间推移哈,变得越来越好的对吧?但是这时我们必须解决的问题。因此呢我们创建了一个事实核查员机器人,对?有两种方式创建啊,一个呢是比较直接的。另外一个呢是比较高级的。如果你不用chaGP的。
|
||||
|
||||
- 
|
||||
|
||||
- 如果你用的不是chGPT的外部端啊,那么你就干脆没接触过这方面的功能啊。因为移动端也好啊,桌面端也好,它就不显示这个功能的入口。
|
||||
|
||||
- 
|
||||
|
||||
- Yeah.最后呢我们做了一个哈chGPT各个端的细节上的比较,并且留了一个作业,提醒大家说,其实呢我们要学的除了哈关于chGPT的一些信息之外,更重要的是我们大脑当中的啊工作流程啊,我们的思考方式,对吧?所以关于工具的哈普遍规则通用规则或者是通用方法论啊,我们要不停的打磨,包括这节课的一个作业也是对。以这个工具啊通用方法论的进一步啊打磨。好,我们这节课呢到这里,我们下一次分享再见。
|
||||
|
||||
- Yeah.最后呢我们做了一个哈chGPT各个端的细节上的比较,并且留了一个作业,提醒大家说,其实呢我们要学的除了哈关于chGPT的一些信息之外,更重要的是我们大脑当中的啊工作流程啊,我们的思考方式,对吧?所以关于工具的哈普遍规则通用规则或者是通用方法论啊,我们要不停的打磨,包括这节课的一个作业也是对。以这个工具啊通用方法论的进一步啊打磨。好,我们这节课呢到这里,我们下一次分享再见。
|
||||
Reference in New Issue
Block a user