西甲国家德比结果|西甲球队缩写

您當前所在位置:首頁 > PPT課件 > 化學課件PPT → 化學計量學基礎ppt

化學計量學基礎ppt

PPT預覽

化學計量學基礎ppt

PPT內容

這是化學計量學基礎ppt下載,主要介紹了分析化學數據;光譜數據和定量校正曲線;光譜成像數據;化學計量學簡介;化學計量學定義;化學計量學的典型應用,歡迎點擊下載。

高等儀器分析 -化學計量學主講人:杜一平分析化學數據實驗數據化學分析:單點數據儀器分析:多維數據數據維數增加 0維-標量;1維-向量;2維-矩陣;3維-張量;… 樣本數量增大數據量越來越大趨勢,數據庫,海量數據,大數據(big data) 大數據量顯然信息量大,但挖掘有用信息難度也大;數據處理方法研究越來越重要:化學計量學方法應用不止局限于分析化學學科:相關學科不同產地南豐蜜桔HPLC指紋圖譜收集江西(18個)、福建(18個)、湖南(18個)和廣西(10個)南豐蜜桔樣品,經有機溶劑提取后進行HPLC分析 X:46×4632 對64個HPLC色譜圖進行主成分分析:X = U S VT 特征值:前3個主成分特征值的所占比例,58.0%、11.2%、8.4%,剩余21.4% Scores散點圖:樣本點分類光譜數據和定量校正曲線光譜成像數據蛋白質各級結構 (a) Primary structure (b) Secondary structure Alu-Glu-Val-Thr-Asp-Pro-Gly- α-Helix β-Sheet (c) Tertiary structure (d) Quaternary structure 圖 肽鏈在空間卷曲特定的三維空間結構數據的表達-數字化 0維-標量:x=2;1維-向量:x=[1 3 5 7]; 2維-矩陣:X=; 3維-張量:Z=[X1 X2 X3 …] 化學計量學簡介化學計量學簡介化學計量學定義化學計量學發展化學計量學的典型應用傳統定性定量分析:多元分辨、多元校正儀器量測信號處理:數據處理方法、最優化方法模式識別:污染源識別、疾病診斷、中藥識別、…;試驗設計:分子設計和藥物設計:新藥發現及結構性能關系(QSAR)研究;過程分析:工業過程監測和控制。化學計量學基本特點多維數據:向量,矩陣,張量。多變量數據來自各種測量:典型的為儀器分析數據。信息提取方法:利用各種手段持續發展的科學化學計量學研究內容化學計量學方法:常用數據處理方法平滑窗口移動平均法 Savitzky-Golay平滑法-多項式擬合 Savitzky-Golay平滑權重系數表 (多項式階次為2或3)求導 提高信號的分辨率,減少干擾。紫外-可見光譜分析中用到的導數分光光度分析; 近紅外光譜分析中,常用2階或1階導數光譜進行定性定量分析; 電化學分析中,有時利用對溶出伏安曲線求導來去除或減少其它組分的干擾,提高被測組分的信噪比。有很多種類的分析儀器已經把求導作為一種固定的方法,加入到儀器的數據處理軟件中 。 1.差分法窗口寬度k=9,p=4,3階導數表達式, d3x/dj3|j=0=1/198( -14x -4+ 7x -3+ 13x -2+ 9x -1-9 x1-13x2-7x3+ 14x4) 擬合實驗數據理論解釋研究變量之間關系:y=f(x) 多個變量 y=f(x1,x2,…) 函數擬合基本思想 =f(a,x) Ei= - yi = f(a,xi) -yi 差方和ΣE2最小。擬合計算工具 Excel 主成分分析主成分分析,Principal Component Analysis, PCA 最基本的化學計量學方法之一是很多復雜化學計量學方法的基礎應用廣泛主成分分析四個產地南豐蜜桔樣品HPLC分析 X:46×4632 對64個HPLC色譜圖進行主成分分析:X = U S VT 特征值:前3個主成分特征值的所占比例,58.0%、11.2%、8.4%,剩余21.4% Scores散點圖:樣本點分類主成分分析 一種重要降維方法基本思想:對量測矩陣Y中的各個變量進行線性組合,形成新的變量,稱為主成分。主成分計算原則是得到主成分表達的方差最大,化學意義就是所含信息最多。計算方法:按方差最大,計算各個變量的線性組合,得到第一主成分;對剩余的矩陣,即量測矩陣Y減去第一主成分表達部分,再按方差最大原則,計算各個剩余變量的線性組合,得到第二主成分;依次計算第三、第四、… 主成分。新變量之間相互正交。方差代表表達的信息量,按順序減少,可用來評估主成分解釋的信息百分率。 Matlab方法 [U,S,V]= svds(X,n) 多個主成分,多個投影方向多維主成分分解(n) x=[x1 x2 ... xn] 將x投影到[vi1 vi2 … vin]t上得到新變量yi, [vi1 vi2 … vin]t就是系數向量,即投影方向。所有n個新變量組成矩陣Y yi=vi1x1+vi2x2+…+vinxn ,(i=1,2,…,n) 例高分子液晶材料在不同溫度下結晶情況 Infrared transmission spectra of 11-layer LB films of FLC-1 measured at room and elevated temperatures. Temperature dependences of the frequencies of the CH2 symmetric stretching band (a), C=O stretching band of the part near the chiral carbon atom (b) and the phenyl ring stretching band (c) for the 11-layer LB films of FLC-1. PC1 vs. temperature plot in both 40-80C (a) and 27-55C (c) temperature intervals and those in full measured temperature range (b) at range of 1450-1745 cm–1 for the 11-layer LB films of FLC-1. 幾種化學計量學方法簡介多元校正多元分辨模式識別定量構效關系最優化方法多變量校正多元線性回歸MLR 多元線性回歸方法-最小二乘法: y=Xc+e e = y- Xc 殘差平方和 S= ete = (y- Xc)t(y- Xc) =yty-yt(Xc)-(Xc)ty +(Xc)t(Xc) =yty - ytXc - ctXy +ctXtXc =yty - 2ytXc +ctXtXc = -2Xty +2XtXc=0 則, XtXc =Xty =(XtX)-1Xty Matlab: c=inv(X’*X)X’*y 多元線性回歸解具有優良的統計學性質多元線性回歸解的性能指標 =(XtX)-1Xty , =X 相關系數:R2= =1 - 殘差平方和RMS 多元線性回歸應用建模與濃度計算 y=Xc+e 常見多元校正方法四種不同液體表面活性劑 NIR光譜PLS校正結果 (兩個組分校正) 多變量分辨麥秸高溫高壓裂解氣相產物,GCMS分析經HELP解析確定了整個保留時間內共有組分45個 化學模式識別 模式識別方法:定量構效關系藥物設計:是現代化新藥開發工作非常重要的一個環節,從20世紀60年代以來,經過40多年的不斷探索和努力,現代藥物設計的策略和方法已經大為豐富。最基本的藥物設計方法就是從一組(例如幾十個)小分子化合物的結構和生物活性數據出發,利用定量構效關系方法,研究其結構-活性關系的規律,在此基礎上預測新化合物的生物活性(藥效)和進行高活性分子的結構設計。分子設計:材料分子設計,熒光探針分子設計等。現代最優化方法 現代最優化方法 - 搜索全局最優解 模擬退火法 遺傳算法 人工神經網絡 蟻群算法 粒子群算法遺傳算法(Genetic Algorithm,GA) 達爾文進化論思想,適者生存模擬生物的自然進化過程進行最優解搜索。自然進化的特征在20世紀60年代得到美國Michigan大學的John Holland極大興趣,他和他的學生們吸收了自然進化的思想,提出機器學習的新算法,Holland將其取名為遺傳算法。 1975年,Holland出版了頗有影響的專著Adaptation in Natural and Artificial Systems, 之后,遺傳算法才逐漸被人們所知。 遺傳算法基本思想生物遺傳基本單元個體染色體(基因)種群繁殖過程進化規則:優勝劣汰遺傳算法由六個基本的操作組成: 1)編碼:根據要解決問題的特征,將問題的解在其解空間中表示成遺傳空間的基因型串結構數據(染色體)。 2)初始群體的生成:隨機產生N個初始串結構數據,每個串結構數據稱為一個個體,N個個體構成了一個群體。 3)適應性值評估檢測:適應性函數表明個體或解的優劣性。 4)選擇:目的是為了從當前群體中選出優良的個體,使它們有機會作為父代為下一代繁殖子孫。 5)交叉:最主要的遺傳操作。通過交叉換操作可以得到新一代個體,新個體組合了其父輩個體的特性。交叉換體現了信息交換的思想。隨機產生交叉。 6)變異:首先在群體中隨機選擇一個個體,對于選中的個體以一定的概率隨機地改變串結構數據中某個串的值。遺傳算法實例 151種血腦屏障穿透化合物,利用遺傳算法從154種分子結構描述符中選擇有限數目的描述符,建立這些化合物結構與血腦屏障穿透能力之間的關系,本項工作的關鍵就是變量選擇(即描述符選擇)。 解題難點變量優劣評價方法 151個樣本變量組與指標建模,考察模型好壞。變量選擇方案窮舉:變量組合數目及其龐大, ,其中, 繼續計算out of memory。無法計算。單因素輪換:單變量最優-加入第二變量-…-最后,從中選擇最優結果,154+153+…+1=11935,貪婪算法,局部最優遺傳算法思路隨機安排初值三種進化機制優化變量進化過程隨機性避免落入局部最優 1)二進制編碼:用154位的二進制串來表示變量,即表示154個結構描述符,如果串中某位為0表示對應的變量沒有被選擇,反之為1就是選擇了該變量。 2)適應性函數FIT :用選擇的變量代表化合物結構,用多元線性回歸方法MLR建立變量與血腦屏障穿透能力之間的構效關系模型,利用去一交互檢驗法LOO計算相關系數Q。式中的n是化合物數目,k為所選變量個數。 FIT越大越好。 3)群體大小為500,進化次數,即迭代次數定為5000次。 4)遺傳算法計算- 隨機性初始二進制編碼為隨機產生使用輪賭方式進行選擇,交叉和變異發生的點位都隨機產生,交叉時,將雙親二進制串從隨機產生的交叉點向后的所有位進行交叉,變異時每次只是對隨機產生的點進行變異。交叉和變異對進化過程影響非常大,所以對它們加以限制,即并非每次都發生交叉和變異,而是用概率來進行控制,交叉概率為0.6,變異概率為0.2。交叉變異 5)對這組數據進行計算后,最優結果選擇了6個變量,得到的構效關系模型如下: LogBB=0.120-0.0016×[50]+0.0014×[69]-0.0011×128]+0.0057×146]-0.0108×[147] +0.0395×[152] 遺傳算法本質提供一個最優解搜索策略很多操作參數需選擇和優化隨機性三個優化方式是核心人工神經網絡(Atificial Neurial Network,ANN) 1943年,Warren McCulloch和Walter Pitts根據已知的神經細胞生物過程原理,構造了人類歷史上第一次的人工神經元,后來,人們稱它為M-P模型。各種人工神經網絡:感知機、自適應線性神經網絡、Hopfield網絡模型、Boltzman機、反向誤差傳播訓練算法等 非線性關系生物神經元組成:細胞體、樹突和軸突樹突:接受外界信號軸突:向其他神經元傳遞信息細胞體:處理信號生物神經系統人的神經系統1011個神經元每一個生物神經元都是生物組織和化學物質的有機結合 人工神經元人工神經網絡: BP模型-反向誤差傳播人工神經網絡 BP算法提供了一種尋優的框架圍繞算法的基本框架,適當調整網絡內容,到達更好的運算結果 人工神經網絡實例-定量分析多元校正:非線性關系苯巴比妥、安替比林、鹽酸麻黃堿、非那西丁、咖啡因、茶堿和可可堿7種組分,配制不同濃度搭配的混合液27個。在190-320nm光譜范圍測定各個混合液的紫外光譜。此體系光譜在190-320nm范圍內為非線性光譜。將光譜數據進行主成分分析選擇使8個主成分,并進行數據歸一化。輸入數據:27樣品×8變量輸出目標:7種組分的濃度輸入層有9個神經元,分別輸入8個主成分數據和一個偏置信號隱含層也有9個神經元輸出層有一個節點,輸出被測組分濃度 。輸出函數使用S函數。各個初始權值Wij和Wjk,都在區間[-0.5,0.5]內隨即產生。 18個樣品數據作為訓練集,用于學習 6個作為監控集,用于監控訓練過程,確定何時終止訓練 3個作為未知集,用于對整個模型進行檢驗用BP算法和PLS算法得到的苯巴比妥、鹽酸麻黃堿、咖啡因的計算誤差 Thank you !

相關PPT

中國計量學院ppt:這是一個關于中國計量學院ppt,主要介紹了中國計量學院簡介、歷史沿革、校訓、院系設置、學科介紹、校園一景等內容。
《化學計量學基礎ppt》是由用戶huangyixuan于2019-10-27上傳,屬于化學課件PPT。

標簽:

相關PPT

縮略圖

  • 化學計量學基礎ppt
西甲国家德比结果 cba比分表 神庙古墓 湖北彩票开奖30选5 辽宁省体育*十一选 吉林麻将胡牌规则 601268股票行情中心 8足球比分网 甘肃11选5走势图 欢乐麻将免费场版本下载 电竞电竞比分网1zplay 上海有哪些期货配资 山东十一选五前三直 国标麻将番种图解地胡 棒球比分直播日本 2012奥运会男足球直播 新版麻将赢3局扯红包