This analysis demonstrates <b>binary classification</b> which is a common statistical procedure where subjects are classified into two groups based on a classification rule. Binary classification is a procedure where data about the subject is dichotomised to reach a binary decision (e.g., yes/no, true/false). Common binary classification applications are: <ul> <li><b>Medical testing and diagnosis</b> where the classification determines whether a patient has a certain disease or not.</li> <li><b>Spam detection</b> where the classification determines whether a message (e.g., an email) is spam or not.</li> <li><b>Quality control</b> where the classification determines whether an industry standard is met or not.</li> </ul> Because binary classification is often used in medical testing, the terminology surrounding binary classification problems is similar to medical terminology (e.g., prevalence, condition, marker). In practice, there is an important distinction between the <i>true</i> state of the subject and the <i>assigned label</i> given by the classification rule. In JASP, the true state is called <b>condition</b> (positive/negative) and the assigned label is called <b>test</b> (positive/negative). In many applications, the conditions or the tests may not be symmetric, therefore various types of errors are of interest in addition to an overall measure of accuracy. These types of errors distinguish, for example, whether a patient has a disease but the test came back negative (false negative), or whether a patient does not have a disease but the test came back positive (false positive). Properties of the test are usually described in terms of its <b>sensitivity</b> and <b>specificity</b>. Sensitivity is the probability of testing positive if the condition is positive. Specificity is the probability of testing negative if the condition is negative. A property of condition is <b>prevalence</b>, which is the proportion of subjects that have a positive condition in the population. Asymmetric characteristics of the test or prevalence can lead to situations that may appear to the untrained eye as paradoxical. For example, in certain situations it is more likely that a patient does not have a particular disease than that they do, even after testing positive for that disease. Formally, the probability that a subject has a positive condition after the test is positive (i.e., the positive predictive value) is obtained by applying <b>Bayes theorem</b>: %s <h5>References</h5> Pepe, M. S. (2003). <i>The statistical evaluation of medical tests for classification and prediction</i>. Oxford University Press. <a href="https://wikipedia.org/wiki/Binary_classification">https://wikipedia.org/wiki/Binary_classification</a> <a href="https://wikipedia.org/wiki/Evaluation_of_binary_classifiers">https://wikipedia.org/wiki/Evaluation_of_binary_classifiers</a> <a href="https://wikipedia.org/wiki/Bayes%%27_theorem">https://wikipedia.org/wiki/Bayes%%27_theorem</a>
この分析は、分類ルールに基づいて被験者を2つのグループに分類する一般的な統計手順である<b>二項分類</b>を示しています。 二値分類とは、対象者に関するデータを二分して、二値の決定(例:Yes/No、true/false)に到達させる手順です。 一般的なバイナリ分類のアプリケーションは以下の通りです。 <ul> <li><b>医学検査・診断</b> 患者が特定の病気にかかっているかどうかを判断するための分類</li> <li><b>スパム検出</b> メッセージ(例:電子メール)がスパムかどうかを分類する場合</li> <li><b>品質管理</b> 業界標準が満たされているかどうかを分類する場合</li> </ul> 二値分類は医学的なテストでよく使われるため、二値分類問題の用語は医学辞書を参考にしています (例: prevalence, condition, marker)。 実際には、対象者の<i>真の</i>状態と、分類ルールによって与えられた<i>割り当てられたラベル</i>との間には、重要な区別があります。JASPでは、真の状態を<b>条件</b>(ポジティブ/ネガティブ)と呼び、割り当てられたラベルを<b>テスト</b>(ポジティブ/ネガティブ)と呼びます。多くの応用例では、条件やテストが対称的ではない場合があり、そのため、全体的な精度の測定に加えて、さまざまなタイプの誤差が注目されます。これらのタイプのエラーは、例えば、患者がある状態に苦しんでいるのに、テストが陰性になった(偽陰性)のか、あるいは、患者がある状態に苦しんでいないのに、テストが陽性になった(偽陽性)のかを区別します。 テストの特性は、通常、<b>感度</b>と<b>特異度</b>という言葉で表現されます。感度とは、状態が陽性である場合に陽性と判定される確率のことです。特異度とは、条件が陰性の場合に陰性と判定される確率のことです。条件の特性とは、<b>有病率</b>のことで、これは母集団の中で条件が陽性である被験者の割合を意味します。 テストや有病率の特性に偏りがあると、素人目には逆説的に見えるような状況になることがあります。例えば、ある状況では、ある病気の検査で陽性であっても、患者がその病気に罹患していない可能性の方が高い場合があります。 形式的には、検査で陽性になった後、被験者が陽性である確率(すなわち、陽性予測値)は、<b>ベイズの定理</b>を適用することで得られます。 <img src = "file://%s", width="500">。 <h5>参考文献</h5> </h5 Pepe, M. S. (2003).<i>The statistical evaluation of medical tests for classification and prediction</i>.Oxford University Press. <a href="https://wikipedia.org/wiki/Binary_classification">https://wikipedia.org/wiki/Binary_classification</a> <a href="https://wikipedia.org/wiki/Evaluation_of_binary_classifiers">https://wikipedia.org/wiki/Evaluation_of_binary_classifiers</a> <a href="https://wikipedia.org/wiki/Bayes%%27_theorem">https://wikipedia.org/wiki/Bayes%%27_theorem</a
Binary classification is a procedure where data about the subject is dichotomised to reach a binary decision (e.g., yes/no, true/false).
Common binary classification applications are:
<ul>
<li><b>Medical testing and diagnosis</b> where the classification determines whether a patient has a certain disease or not.</li>
<li><b>Spam detection</b> where the classification determines whether a message (e.g., an email) is spam or not.</li>
<li><b>Quality control</b> where the classification determines whether an industry standard is met or not.</li>
</ul>
Because binary classification is often used in medical testing, the terminology surrounding binary classification problems is similar to medical terminology (e.g., prevalence, condition, marker).
In practice, there is an important distinction between the <i>true</i> state of the subject and the <i>assigned label</i> given by the classification rule.
In JASP, the true state is called <b>condition</b> (positive/negative) and the assigned label is called <b>test</b> (positive/negative).
In many applications, the conditions or the tests may not be symmetric, therefore various types of errors are of interest in addition to an overall measure of accuracy.
These types of errors distinguish, for example, whether a patient has a disease but the test came back negative (false negative), or whether a patient does not have a disease but the test came back positive (false positive).
Properties of the test are usually described in terms of its <b>sensitivity</b> and <b>specificity</b>.
Sensitivity is the probability of testing positive if the condition is positive.
Specificity is the probability of testing negative if the condition is negative.
A property of condition is <b>prevalence</b>, which is the proportion of subjects that have a positive condition in the population.
Asymmetric characteristics of the test or prevalence can lead to situations that may appear to the untrained eye as paradoxical.
For example, in certain situations it is more likely that a patient does not have a particular disease than that they do, even after testing positive for that disease.
Formally, the probability that a subject has a positive condition after the test is positive (i.e., the positive predictive value) is obtained by applying <b>Bayes theorem</b>:
%s
<h5>References</h5>
Pepe, M. S. (2003). <i>The statistical evaluation of medical tests for classification and prediction</i>. Oxford University Press.
<a href="https://wikipedia.org/wiki/Binary_classification">https://wikipedia.org/wiki/Binary_classification</a>
<a href="https://wikipedia.org/wiki/Evaluation_of_binary_classifiers">https://wikipedia.org/wiki/Evaluation_of_binary_classifiers</a>
<a href="https://wikipedia.org/wiki/Bayes%%27_theorem">https://wikipedia.org/wiki/Bayes%%27_theorem</a>
二値分類とは、対象者に関するデータを二分して、二値の決定(例:Yes/No、true/false)に到達させる手順です。
一般的なバイナリ分類のアプリケーションは以下の通りです。
<ul>
<li><b>医学検査・診断</b> 患者が特定の病気にかかっているかどうかを判断するための分類</li>
<li><b>スパム検出</b> メッセージ(例:電子メール)がスパムかどうかを分類する場合</li>
<li><b>品質管理</b> 業界標準が満たされているかどうかを分類する場合</li>
</ul>
二値分類は医学的なテストでよく使われるため、二値分類問題の用語は医学辞書を参考にしています (例: prevalence, condition, marker)。
実際には、対象者の<i>真の</i>状態と、分類ルールによって与えられた<i>割り当てられたラベル</i>との間には、重要な区別があります。JASPでは、真の状態を<b>条件</b>(ポジティブ/ネガティブ)と呼び、割り当てられたラベルを<b>テスト</b>(ポジティブ/ネガティブ)と呼びます。多くの応用例では、条件やテストが対称的ではない場合があり、そのため、全体的な精度の測定に加えて、さまざまなタイプの誤差が注目されます。これらのタイプのエラーは、例えば、患者がある状態に苦しんでいるのに、テストが陰性になった(偽陰性)のか、あるいは、患者がある状態に苦しんでいないのに、テストが陽性になった(偽陽性)のかを区別します。
テストの特性は、通常、<b>感度</b>と<b>特異度</b>という言葉で表現されます。感度とは、状態が陽性である場合に陽性と判定される確率のことです。特異度とは、条件が陰性の場合に陰性と判定される確率のことです。条件の特性とは、<b>有病率</b>のことで、これは母集団の中で条件が陽性である被験者の割合を意味します。
テストや有病率の特性に偏りがあると、素人目には逆説的に見えるような状況になることがあります。例えば、ある状況では、ある病気の検査で陽性であっても、患者がその病気に罹患していない可能性の方が高い場合があります。
形式的には、検査で陽性になった後、被験者が陽性である確率(すなわち、陽性予測値)は、<b>ベイズの定理</b>を適用することで得られます。
<img src = "file://%s", width="500">。
<h5>参考文献</h5> </h5
Pepe, M. S. (2003).<i>The statistical evaluation of medical tests for classification and prediction</i>.Oxford University Press.
<a href="https://wikipedia.org/wiki/Binary_classification">https://wikipedia.org/wiki/Binary_classification</a>
<a href="https://wikipedia.org/wiki/Evaluation_of_binary_classifiers">https://wikipedia.org/wiki/Evaluation_of_binary_classifiers</a>
<a href="https://wikipedia.org/wiki/Bayes%%27_theorem">https://wikipedia.org/wiki/Bayes%%27_theorem</a