利用統計與神經網路方法模擬美國 HIV 死亡率迴歸模型
Modeling US HIV Mortality Regression Using Statistical and Neural Network Approach
演講摘要 Speech Summary
為了精準刻畫此非線性動態,本研究建立並比較多種神經網路架構,搭配不同的激活函數 (activation functions)與優化演算法(optimization algorithms), 並從最終損失值(final loss)、均方根誤差(RMSE)、訓練穩定性以及計算效率等面向進行評估。 實驗結果顯示,採用 Tanh 激活函數並搭配 Adam 最佳化器的模型在整體表現上最為突出, 展現出神經網路在模擬與預測複雜死亡率變化趨勢上的應用潛力與研究價值。
To model this behavior, several neural network architectures are developed and compared using different activation functions and optimization algorithms. Performance is evaluated using final loss, RMSE, training stability, and computational efficiency. Models using the Tanh activation function with the Adam optimizer perform best, demonstrating the value of neural networks for modeling nonlinear mortality trends.

演講主題 (Presentation Topic)
題目: 利用現代類神經網路模擬美國女性 HIV 死亡率趨勢 Title: Modeling Female HIV Mortality Trends in the US Using Modern Neural Networks 講者: 郭之領(來自馬來西亞的交換生)
1. 研究背景與目的 (Introduction & Objective)
-
English: The speaker focused on understanding US female HIV mortality trends using Neural Networks (NN). The key question was whether NNs could capture the changing directions of the trend (increasing then decreasing) better than traditional regression methods.
-
中文: 講者專注於使用類神經網路(NN)來理解美國女性 HIV 死亡率的趨勢。核心問題在於類神經網路是否能比傳統迴歸方法更好地捕捉趨勢的變化方向(先上升後下降)。
2. 研究方法 (Methodology)
講者建構了計算模型,並測試了不同的「超參數」(Hyperparameters)組合:
-
模型架構 (Model Architecture):
-
English: Five models were tested, ranging from "Model 1" (shallowest, 1 hidden layer) to "Model 5" (deepest, 6 layers).
-
中文: 測試了五種模型,從「模型 1」(最淺層,1 個隱藏層)到「模型 5」(最深層,6 個隱藏層)。
-
-
激勵函數 (Activation Functions):
-
English: Tested ReLU, Tanh, and Sigmoid (transcribed as "sickmoled") to see which fits the non-linear curve best.
-
中文: 測試了 ReLU、Tanh 和 Sigmoid 函數,看哪一個最能擬合非線性曲線。
-
-
優化器 (Optimizers):
-
English: Compared SGD, Adam, and L-BFGS (transcribed as "ofGS/FGS").
-
中文: 比較了 SGD、Adam 和 L-BFGS 三種優化器。
-
-
評估指標 (Metrics):
-
English: Final Training Loss (accuracy), Stability (RMSE), and Execution Time.
-
中文: 最終訓練損失(準確度)、穩定性(均方根誤差 RMSE)和執行時間。
-
3. 研究結果 (Results)
-
激勵函數表現 (Activation Functions Performance):
-
ReLU: Performed poorly ("step-wise" or linear shapes), failed to capture the curve smoothly.
-
Sigmoid: Better than ReLU but still had limitations.
-
Tanh: Produced the smoothest and most accurate predictions, best fitting the "rise and fall" trend of HIV mortality.
-
中文: ReLU 表現不佳(呈現階梯狀或線性),無法平滑捕捉曲線;Sigmoid 比 ReLU 好但仍有限制;Tanh 表現最好,能產生最平滑且準確的預測,最能擬合 HIV 死亡率「先升後降」的趨勢。
-
-
優化器表現 (Optimizers Performance):
-
SGD: Unstable and sensitive to learning rates.
-
Adam: The most consistent, stable, and efficient optimizer.
-
L-BFGS: Powerful but execution time varies heavily depending on the network depth.
-
中文: SGD 較不穩定且對學習率(Learning Rate)敏感;Adam 是最一致、穩定且有效率的優化器;L-BFGS 雖然強大但執行時間受網路深度影響很大。
-
4. 結論 (Conclusion)
-
English: The best configuration was Model 4 or 5 (Deep) using Tanh activation and Adam optimizer. This setup provided the lowest final loss and captured the non-linear relationship effectively, proving Neural Networks are flexible tools for public health forecasting even with small datasets.
-
中文: 最佳的配置是模型 4 或 5(深層網路),搭配 Tanh 激勵函數與 Adam 優化器。此組合提供了最低的損失值並有效捕捉了非線性關係,證明即使數據集較小,類神經網路仍是公共衛生預測的靈活工具。
教授講評與現場互動 (Professor's Comments & Q&A)
教授的技術補充 (Technical Feedback):
-
模擬次數: 實驗跑了 10,000 次模擬以確保結果的比較具有統計意義。
-
平滑度解釋: 雖然原始數據只有 13 個點(看起來像連線),但模型預測出的 87 個點非常平滑。這是因為 Tanh 和 Sigmoid 本身就是平滑函數,透過內插(Interpolation)展現了非線性的平滑趨勢。
-
未來建議: 鼓勵在場學生可以嘗試將數據延伸到 2023 或 2024 年,驗證模型的預測準確度。
現場互動 (Interaction):
-
教授稱讚講者的英文很好,雖然有點緊張但在國外生存(求學)就是這樣,鼓勵學生多練習英文。
-
最後進行大合照,慶祝講者順利完成書報討論。
%20(3000%20x%20590%20%E5%83%8F%E7%B4%A0)%20(1).png)