召回率(Recall)和精确率(Precision)是衡量分类模型性能的指标。
召回率是指模型正确识别出的正样本的比例,也就是模型能够找到全部正样本的能力。其计算公式为:召回率= 正确识别的正样本数 / 真实的正样本数精确率是指模型正确识别出的正样本占所有被模型识别为正样本的比例,也就是模型对于正样本的判断准确性。其计算公式为:精确率= 正确识别的正样本数 / 所有被识别为正样本的样本数区别:- 召回率关注的是模型对于正样本的查全率,即尽可能多地找到正样本,不关注负样本的分类情况。而精确率关注的是模型对于正样本的判断准确性,即被模型判断为正样本的样本中有多少是真正的正样本。- 召回率描述了模型的查全能力,可以衡量模型忽略多少真实的正样本,因此对于涉及到遗漏风险较高的任务,如疾病诊断等,召回率一般要求较高。而精确率描述了模型的判断准确性,可以衡量模型对负样本的错误分类情况,因此对于需要确保分类准确性的任务,如垃圾邮件识别等,精确率一般要求较高。- 在二分类任务中,召回率和精确率常常存在一种“取舍”现象,提高召回率可能会导致降低精确率,提高精确率可能会导致降低召回率。因此,在实际应用中,需要根据具体任务的需求来权衡召回率和精确率,并选择合适的阈值或调整模型来平衡二者。