Metoda głównych składowych w analizie danych wielowymiarowych: podejście niestandardowe

Prelegent: 

Dr Grażyna Czerniak

Data: 

25/10/2023 - 10:00

Sygnały instrumentalne uzyskane dla złożonych próbek posiadają duży zasób informacji. W efekcie, bardzo kłopotliwe staje się analizowanie złożonych danych eksperymentalnych bez użycia technik statystycznej analizy wielowymiarowej takich jak metoda głównych składowych (z ang. Principal Component Analysis, PCA). W standardowych zastosowaniach metoda PCA jest używana do kompresji danych poprzez porządkowanie informacji wg. malejącej wariancji, modelowania i wizualizacji struktury danych, określania ilości chemicznie/fizycznie interpretowalnych składowych, redukcji poziomu szumów w danych.

Podczas referatu zaprezentowane zostaną przykłady zastosowania metody PCA, w przypadku, gdy metody analizy, typowe dla danej techniki/ dyscypliny, mają ograniczenia. W szczególności omówione zostanie użycie PCA do:

• Opracowania nowej metody chemometrycznej służącej szybkiej identyfikacji potencjalnych związków chemicznych zawartych w próbkach wieloskładnikowych; selekcja dużego zbioru danych referencyjnych możliwa jest poprzez zastosowanie odwróconego algorytmu postepowania.

• Opracowania nowej metody chemometrycznej, SQPCA, do oznaczania ilościowego pojedynczego analitu w złożonej mieszaninie. W przeciwieństwie do zaproponowanych do tej pory algorytmów, opartych na danych nazywanych z ang. second-order data (tzn. próbkę opisuje matematycznie macierz danych), zaproponowana metoda SQPCA jest jednowymiarowa tzn. informację ilościową o próbce otrzymuje się na podstawie pojedynczego wektora danych (tzw. first-order data).

• Opracowania statystycznego indeksu do monitorowania wielu parametrów fizyczno-chemicznych i biologicznych próbek wody jednocześnie, oraz do wczesnego wykrywania próbek atypowych na przykładzie danych rzeki Odry.

Historia zmian

Data aktualizacji: 17/10/2023 - 13:30; autor zmian: Przemysław Głomb (przemg@iitis.pl)

Sygnały instrumentalne uzyskane dla złożonych próbek posiadają duży zasób informacji. W efekcie, bardzo kłopotliwe staje się analizowanie złożonych danych eksperymentalnych bez użycia technik statystycznej analizy wielowymiarowej takich jak metoda głównych składowych (z ang. Principal Component Analysis, PCA). W standardowych zastosowaniach metoda PCA jest używana do kompresji danych poprzez porządkowanie informacji wg. malejącej wariancji, modelowania i wizualizacji struktury danych, określania ilości chemicznie/fizycznie interpretowalnych składowych, redukcji poziomu szumów w danych.

Podczas referatu zaprezentowane zostaną przykłady zastosowania metody PCA, w przypadku, gdy metody analizy, typowe dla danej techniki/ dyscypliny, mają ograniczenia. W szczególności omówione zostanie użycie PCA do:

• Opracowania nowej metody chemometrycznej służącej szybkiej identyfikacji potencjalnych związków chemicznych zawartych w próbkach wieloskładnikowych; selekcja dużego zbioru danych referencyjnych możliwa jest poprzez zastosowanie odwróconego algorytmu postepowania.

• Opracowania nowej metody chemometrycznej, SQPCA, do oznaczania ilościowego pojedynczego analitu w złożonej mieszaninie. W przeciwieństwie do zaproponowanych do tej pory algorytmów, opartych na danych nazywanych z ang. second-order data (tzn. próbkę opisuje matematycznie macierz danych), zaproponowana metoda SQPCA jest jednowymiarowa tzn. informację ilościową o próbce otrzymuje się na podstawie pojedynczego wektora danych (tzw. first-order data).

• Opracowania statystycznego indeksu do monitorowania wielu parametrów fizyczno-chemicznych i biologicznych próbek wody jednocześnie, oraz do wczesnego wykrywania próbek atypowych na przykładzie danych rzeki Odry.