# 5. A類不確定度評估
>[name=李奕璟]
>
>[name=豪豬教授(審訂)]
>
>[time=May 1, 2024]
###### tags: `測量` `誤差分析` `不確定度` `隨機變數` `標準差`
---
>相較於[B類不確定度評估](https://qubear.hackmd.io/@QuBear/DataAnalysis-4),具備明確計算步驟的A類不確定度評估更常出現於高中選修物理的考題之中,而繁雜的計算門檻,卻也容易使人忽略背後的統計意涵。本篇文章除了簡介A類不確定度評估步驟以外,也會針對過往對於隨機誤差與A類不確定度之間的連結迷思做進一步地釐清。經由再次內化測量結果與隨機變數的關係,我們試著藉由統計以及相關的數學技巧,用不同的觀點重新認識A類不確定度,也在此過程中理解重複測量對於減少誤差的實質含意。
## 高中老師可能教過你的事
### A類不確定度評估簡介
在相同條件下針對一物理量進行$n$次重複測量,可得$x_1$、$x_2$...$x_n$共$n$個數據,同時可利用A類不確定度評估量化此組數據之測量結果,其步驟如下所述:
1. 計算算數平均值$\bar{x}$,並且暫時保留所有顯示位數:
$$
\bar{x}=\frac{x_1+x_2+...x_n}{n}
$$
2. 計算[樣本標準差](https://qubear.hackmd.io/@QuBear/ProbandCal-7)$s$,並且暫時保留所有顯示位數:
$$
s=\sqrt{\frac{\sum^{n}_{i=1}(x_i-\bar{x})^2}{n-1}}
$$
3. 計算**A類不確定度$u_A$**,並且以**無條件進位法**,至多保留2位有效數字:
$$
u_A=\frac{s}{\sqrt{n}}
$$
4. 將步驟1計算之算數平均值$\bar{x}$之數值以**四捨五入法**取至與A類不確定度$u_A$之最末位一致,並以此值作為**最佳估計值**。
5. 結合步驟3與步驟4,將測量結果表示為:
$$
測量結果=最佳估計值{\pm}A類不確定度
$$
以測量身高為例,當使用傳統的木尺作為測量工具時,每次測量仍會有著不可避免的估計差異,進而產生不同的測量值,而A類不確定度即是利用統計分析的數學方法,進一步的量化這類型的誤差來源。由下圖可發現,即便使用相同的測量工具,不同的測試者或是輔助工具仍會造成影響,而藉由A類不確定度評估,便能直接量化測量品質,同時可作圖比較不同測量方式的優劣。

>圖片來源:選修物理一(全),CH01測量與不確定度。龍騰文化。
### 隨機誤差與A類不確定度評估
在[從誤差到不確定度](https://qubear.hackmd.io/@QuBear/DataAnalysis-1)一文中提及,誤差可分為兩大類:**隨機誤差**與**系統誤差**。許多人常會因為計算過程涉及標準差的計算,而認定A類不確定度評估為隨機誤差的量化結果,然而這卻是個迷思。事實上,A類不確定度評估除了隨機誤差以外,也很可能伴隨著系統誤差。
以最直觀的平移效應為例,若測量儀器因校正疏失造成歸零不確實,則最終的測量結果可能會比正常情況下來得高或是低,像這樣整體數值高估或是低估的情形被歸類於系統誤差的一部分,然而這在A類不確定度分析中並沒有辦法顯現出來,換言之,**A類不確定度評估並無法完全排除系統誤差**。
## 一些你可能還不知道的事
### 藏在測量結果背後的統計分布
在[隨機試驗與隨機變數](https://qubear.hackmd.io/@QuBear/ProbandCal-3)的討論中已說明測量結果被視為隨機變數的緣由,這代表雖然個別的測量最終看似都會對應到特定數值,然而這些數字背後藏著的卻是龐大的統計資訊。
以重複進行數次的骰子試驗為例,不論先前的結果為何,都不會影響到下一次投擲所對應之機率分布。換言之,每次的試驗結果都可被視為**獨立的隨機變數**,而這樣的概念也同樣適用於測量行為中,差別在於藏在測量背後的各個結果機率分布並非完全相同。
在沒有太多資訊背景的前提下,直覺告訴我們每次測量中的隨機變數會對應到有如鐘型般的[常態分布](https://qubear.hackmd.io/@QuBear/ProbandCal-4)——幸運的是,許多時候這是對的。事實上,**中央極限定理**可證明即便母體空間的機率密度函數為任意形式,其隨機構成的樣本空間結果總和(或是平均值)都必定會收斂為常態分布。從下圖的骰子試驗示例可發現當同條件下投擲的骰子數量逐漸增多時,其面朝上的數值總和所對應的機率也會逐漸趨近於鐘型分布,無關乎母體空間的分布形式。

>圖片來源:Les Kirkup and Bob Frenkel(2006).An Introduction to Uncertainty in Measurement.Cambrige University Press.
### 從統計分析重新認識A類不確定度評估
認同單次測量結果的本質是隨機變數後,看待A類不確定度評估步驟的視角也會有所不同。若以$x_i$代表進行第$i$次實驗的測量值,當已知本組實驗在相同條件下共進行$n$次測量時,可得最佳估計值$\bar{X}$:
$$
\bar{X}=\frac{x_1+x_2+...x_n}{n}
$$
需注意的是,在此$\bar{X}$同樣也是隨機變數!同時,由於實驗測量值均隸屬於[樣本空間](https://qubear.hackmd.io/@QuBear/ProbandCal-6)之中,因此需計算$\bar{X}$之期望值$E(\bar{X})$,才能[無偏誤地估計母體空間之結果](https://qubear.hackmd.io/@QuBear/ProbandCal-7),故可得:
$$
E(\bar{X})=E(\frac{x_1+x_2+...x_n}{n})=\frac{E(x_1)+E(x_2)+...+E(x_n)}{n}=\frac{n\mu}{n}=\mu
$$
其中$\mu$即為數據在樣本空間之算數平均值,故將其視為最佳估計值也符合無偏誤估計的運算結果。
除了平均值以外,評估發散程度也是了解隨機變數相當重要的一環,然而第一感冒出來的[樣本標準差](https://qubear.hackmd.io/@QuBear/ProbandCal-7)所評估的卻是單次測量的隨機變數$x_i$,針對$n$次獨立測量的平均值$\bar{X}$則需要使用額外的數學技巧求出**樣本平均值的標準差**。
在[計算不確定度組合](https://qubear.hackmd.io/@QuBear/DataAnalysis-1)的討論中,若欲測量的物理量$y$由互相獨立的變數$x_i$組成,則可利用[偏微分](https://qubear.hackmd.io/@QuBear/ProbandCal-1)得到各個變數的離散程度$u_{x_i}$與組合後的變數之離散程度$u_y$之間的關係式:
$$
u_y^2=(\frac{\partial{y}}{\partial{x_1}})^2u_{x_1}^2+(\frac{\partial{y}}{\partial{x_2}})^2u_{x_2}^2+...+(\frac{\partial{y}}{\partial{x_n}})^2u_{x_n}^2
$$
在此例中,由於每個測量結果$x_i$條件皆相同,故所對應的離散程度$u_{x_i}$均為相同的樣本標準差$s$,且因為$y=\bar{X}$,故可得:
$$
y=\bar{X}=\frac{x_1+x_2+...x_n}{n}\\
\frac{\partial{y}}{\partial{x_1}}=\frac{\partial{y}}{\partial{x_2}}...=\frac{\partial{y}}{\partial{x_n}}=\frac{1}{n}
$$
因此,由前述可整理而得$u_y$與$s$之間的關係式:
$$
u_y^2=\frac{1}{n^2}(ns^2)=\frac{s^2}{n}\\
u_y=\frac{s}{\sqrt{n}}
$$
其中$u_y$即為隨機變數$\bar{X}$的標準差,而這即為此番測量之A類不確定度——在統計學中又別稱**標準誤(Standard Error)**。這個非常容易與標準差(Standard Deviation)混淆的統計名詞,擁有著與標準差截然不同的含義,藉由下方影片可以更直接地了解兩者之間的差異。
<iframe width="100%" height="400" src="https://www.youtube.com/embed/A82brFpdr9g" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" allowfullscreen></iframe>

>圖片來源:Les Kirkup and Bob Frenkel(2006).An Introduction to Uncertainty in Measurement.Cambrige University Press.
上圖為在平均值為$0.3$、標準差為$1$且為常態分布的母體空間中,分別選擇不同樣本數$n$的平均值$\bar{x}$所對應的機率密度函數$p(\bar{x})$分布圖。可發現當樣本數增多時,除了樣本平均值等於母體平均值的機率大幅提升以外,其分布的寬度也會隨之收斂,因此可預期當樣本數趨近於無限大時,樣本平均值也會漸趨於母體平均的結果。
## 總結一定要記得的這件事
相較於[B類不確定度評估](https://qubear.hackmd.io/@QuBear/DataAnalysis-4),A類不確定度評估的概念已常見於高中物理試題之中,然而許多學生僅只掌握其計算步驟,而對於蘊含其中的統計意義仍不太了解,最主要的原因在於忽略[測量即為隨機試驗](https://qubear.hackmd.io/@QuBear/ProbandCal-3)的本質意涵。
:::warning
只要掌握了測量結果即為隨機變數的關鍵,同時搭配在[樣本空間](https://qubear.hackmd.io/@QuBear/ProbandCal-6)中[無偏誤地估計母體空間結果](https://qubear.hackmd.io/@QuBear/ProbandCal-7)的精神,只要使用適當的數學技巧,就能自然而然地運用標準誤的概念重新理解A類不確定度,並且認清原來一次又一次的測量並非徒勞無功,也才真正地將思維從[直觀的誤差緩步邁入能定量分析的不確定度](https://qubear.hackmd.io/@QuBear/DataAnalysis-1)。
:::
