样本的拼音是什么(彻底了解样本TP、FP、TN、FN、ROC、PR)

摘要:本文介绍了样本的拼音及其相关统计参数的概念和定义,包括正类和负类的区分,四种可能的组合情况TP、FN、FP、TN,以及基于这些样本的四个比例形式的统计量,如真阳率、伪阳率等。作者通过复习和阅读模式识别书籍,对统计参数有了更深刻的理解和记忆,同时介绍了书中作者的严谨独特风格和在复习阶段对老师真实体会的描述。通过总结这些内容,本文旨在帮助读者更好地理解和记忆样本及其相关统计参数的概念和应用。

样本拼音是什么:彻底理解样本TP、FP、TN、FN、ROC、PR

仿生中原中也会爱上赤名莉香嘛

样本的拼音是什么(彻底了解样本TP、FP、TN、FN、ROC、PR)

最近,由于期末考试的复习,我仔细阅读了老师的内容。其中,吴建新先生给出了几个关键点,我个人认为这对理解和记忆的统计参数非常有帮助。在去年学习了周志华先生的西瓜书后,每次我使用这些统计量,我都需要翻阅这本书来扩展它ROC曲线、AUC-ROC查全,查全,查准,PR曲线、AUC-PR值等概念的记忆相当麻烦。这一次,通过对刚考完试的理解还没有消退,我总结了书中的内容,用自己的想法记录下来。

?首先,只考虑二分类任务。根据常用术语,将两个累分为正类(positive)和负类(negative)。

?书中给出:样本的拼音是什么?

正类通常是少数类,即样本较少的类(如有缺陷的零件)。负类通常是多数类,即样本较多的类(如合格零件)。

?这不是绝对的,但在大多数情况下,人们如此区分正负。结合当前疫情,如果要对新冠肺炎患者进行检测,可以将新冠肺炎(人群中样本较少)设置为正类,无新冠肺炎(人群中样本较多)设置为负类。

?相应地,用 1和-1表示正负。

?有些学生可能会想,为什么我们必须有两种样本,一种更多,一种更少?请注意,根据吴老师在课堂上和书中的说法,这套统计指标之所以开发,是因为在不平衡或成本敏感的任务中,错误率不是一个很好的评价指标(留作思考,文章最后给出答案)。假设本节的内容是分析不平衡问题,因此有样本和更少的类样本。

?有了上述定义,真实标记和预测标记之间有四种可能的组合,如下表所示:样本的拼音是什么?

?接下来,画重点!书中解释了如何记住这个表格:样本的拼音是什么?

我们使用两个字来确定这四种可能情况中的一种,例如真阳性或伪阴性。在每种可能的情况里,第二个字指的是预测的标记。第一个字用来描述预测是否正确。例如,阳性表示预测标记为阳性( 1),这是错误的(伪);因此,真正的标记是阴性(-1)。我们使用英文首字母缩写来描述这四种情况:TP、FN、FP、TN。

?读到这里,你应该能够闭上眼睛画出上面的表格。如果没有,请耐心再读一遍。把这个表记在心里有助于以后看到TP、FN、FP、TN快速反应其在表格中的位置和对应的情况,对记忆后的延伸统计也很有帮助。

?有了这四个值,我们可以进一步用四个操作来定义比例形式的统计量(吴先生也给出了更方便的理解和记忆的方法)。给出一个包含样本的测试集,我们还使用上述缩写来表示每个样本的数量。TP=37这意味着37个样本是真阳性的。TP、FN、FP和TN定义如下量。

样本总数:正类样本总数(真实标记为 1):负类样本总数(真实标记为-1):精度:错误率:真阳率(TruePositiveRate,TPR):真阳性样本数量占正类样本总数的比例;伪阳率(FalsePositiveRate,FPR):伪阳性样本数量占负样本总数的比例;真阴率(TrueNegativeRate,TNR):这是真阴性样本数量占负类总数的比例;伪阴率(FalseNegativeRate,FNR):这是伪阴性样本数量占类似样本总数的比例。(以上定义从原著中提取,标点符号和排版略有变化。如果有错误,请指出,谢谢。

?重点!为了帮助记住最后四个比例,我们注意到分母可以从定义中的分子中推出。例如,在中间,分子指出伪阳(其真实标记为负),因此分母被确定为负样本的总数。

?同样,在理解了上述段落后,你应该能够正确地回答面试官提出的问题TPR、FPR、TNR、FNR定义。如果没有,请耐心地重复上面的段落。

?之后,书中给出了一些拓展延伸和理解:这些比率在不同领域(如统计学)中也有定义,并且具有不同的名称。例如TPR又称灵敏度(sensitivity),FPR又称漏检率(missrate)。这些名称实际上是在具体的工程场景(疾病检查、二次抽样检查)中获得的结果。

?回到一开始,我们从最原始的评估值准确性和错误率开始,在不平衡场景中进一步定义了上述四个比率。事实上,这些比率可以简单地被视为只评估单个类别样本的结果。例如,如果我们只使用类似()中的样本进行评估,则获得的准确性和错误率分别为和。如果只使用负类,则准确性和错误率分别为和。

?有关ROC曲线,查全查准率和F值笔记,等待更新。

?吴先生和我在人工智能学院毕业生涯中遇到的大多数老师一样,散发着简单而严谨、独特的学术氛围和理性的光辉。本学期每周四上午上四节课,吴先生经常在第三节课开始时声音嘶哑,依靠饮用水和西瓜霜片。我已经很多次了3-4当班级到达教室时,我看到吴老师很快吃了一块零食来补充体力。除此之外,虽然这本模式识别书与之前的本科文凭课程重复了很多内容,但我仍然认为每门课程都可以有很多独特、罕见和新颖的收获。从模式识别的角度来看,这些内容真的会有不同的感觉。不幸的是,虽然我觉得这门课在学期前可以带来很多好处,但我并没有认真对待它。直到期末考试周的复习,我才通过阅读这本书来比较和做笔记,这可能失去了吴先生的精样,我仍然愿意向你推荐这本书。如果我认为这篇文章给出的视角有助于理解和记忆,我不妨再读一遍。

毕业证样本网创作《样本的拼音是什么(彻底了解样本TP、FP、TN、FN、ROC、PR)》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/174538.html

(0)
上一篇 2022年4月27日 上午10:08
下一篇 2022年4月27日 上午10:10

相关推荐

  • 样本的拼音是什么(彻底了解样本TP、FP、TN、FN、ROC、PR)

    摘要:本文介绍了样本的拼音及其相关统计参数的概念和定义,包括正类和负类的区分,四种可能的组合情况TP、FN、FP、TN,以及基于这些样本的四个比例形式的统计量,如真阳率、伪阳率等。作者通过复习和阅读模式识别书籍,对统计参数有了更深刻的理解和记忆,同时介绍了书中作者的严谨独特风格和在复习阶段对老师真实体会的描述。通过总结这些内容,本文旨在帮助读者更好地理解和记忆样本及其相关统计参数的概念和应用。

    2022年4月27日 上午10:09
    270
微信
微信
返回顶部