Zasil swoje dane generatywną sztuczną inteligencją

21 października 2024

Zasil swoje dane generatywną sztuczną inteligencją

Dane są paliwem dla generatywnej sztucznej inteligencji. Ogromne ilości danych i kluczowa zdolność chmury do przechowywania i przetwarzania danych w tej skali spowodowały szybki rozwój potężnych modeli fundamentalnych. Będziesz w stanie dostroić te modele lub użyć rozszerzonego generowania wyszukiwania (RAG), aby dostosować je do swojej działalności - jeśli możesz zebrać rozproszone dane swojego przedsiębiorstwa i udostępnić je.

Ale związek między danymi a sztuczną inteligencją idzie w obie strony - sztuczna inteligencja może być również wykorzystywana do ulepszania i ulepszania danych oraz udostępniania ich do analizy.

Chociaż w ciągu ostatnich kilku lat firmy dużo inwestowały w dane, często okazuje się, że to nie wystarczyło; rozwój sztucznej inteligencji zwrócił ich uwagę na luki w danych i trudności z dostępem do nich lub ich interpretacją. Dane mogą być izolowane w silosach organizacyjnych. Ich jakość może być niska lub mogą być niekompletne. Praca z nimi lub ich interpretacja może być trudna.

Poniżej podam trzy przykłady, w których można wykorzystać sztuczną inteligencję do napędzania danych, a nie odwrotnie. Wybierając priorytety spośród wielu możliwych przypadków użycia sztucznej inteligencji, może się okazać, że takie przypadki zasługują na miejsce na szczycie listy. Mogą one przynieść szybkie korzyści, jednocześnie generując wartość z zasobów danych.

Ograniczenie niezwykle żmudnej pracy (ETL!)

Jednym z najbardziej zasobochłonnych zadań w każdym projekcie dotyczącym danych, często pochłaniającym nawet 60-70% wysiłku, jest przygotowanie i przeniesienie danych do wykorzystania w analityce - tak zwane procesy ekstrakcji, transformacji i ładowania (ETL). To duże obciążenie jest powodem, dla którego AWS pracuje nad przyszłością bez ETL.

Na szczęście można użyć generatywnej sztucznej inteligencji do automatycznej analizy źródłowych i docelowych struktur danych, a następnie pomóc w mapowaniu jednej na drugą. Generatywny asystent kodowania AI AWS, Amazon Q Developer, może budować potoki integracji danych przy użyciu języka naturalnego. Nie tylko skraca to czas i zmniejsza wymagany wysiłek, ale także pomaga zachować spójność w różnych procesach ETL, ułatwiając bieżące wsparcie i konserwację. Przedsiębiorstwa często odkrywają, że posiadają zarówno ustrukturyzowane (np. profile klientów i zamówienia sprzedaży), jak i nieustrukturyzowane (np. media społecznościowe lub opinie klientów) dane, które są przechowywane w różnych źródłach danych, formatach, schematach i typach danych. Integracja danych Amazon Q w AWS Glue może generować zadania ETL dla ponad 20 popularnych źródeł danych, w tym PostgreSQL, MySQL, Oracle, Amazon Redshift, Snowflake, Google BigQuery, DynamoDB, MongoDB i OpenSearch.

Dzięki generatywnej sztucznej inteligencji dla ETL i potoków danych, inżynierowie danych, analitycy i naukowcy mogą spędzać więcej czasu na rozwiązywaniu problemów biznesowych i uzyskiwaniu wglądu w dane, a mniej na układaniu hydrauliki. Jest to przypadek użycia generatywnej sztucznej inteligencji, który większość przedsiębiorstw może rozpocząć już dziś.

Generatywny BI: lepszy wgląd, szybciej

Często mówimy o demokratyzacji danych w całej organizacji - wyjęciu ich z rąk tylko specjalistów i udostępnieniu wszystkim. Analitycy danych i naukowcy zajmujący się danymi często są obciążeni dużymi, złożonymi projektami, co ogranicza ich zdolność do dostarczania wszystkim codziennych, przydatnych informacji. Barierą dla demokratyzacji jest jednak to, że nie każdy ma umiejętności do rygorystycznej i kreatywnej pracy z danymi.

Dzięki generatywnej sztucznej inteligencji można wchodzić w interakcje z danymi za pomocą zapytań konwersacyjnych i języka naturalnego. Nie musisz czekać, aż ktoś stworzy raporty i pulpity nawigacyjne, aby znaleźć informacje, skracając czas uzyskania wartości. Dyrektor ds. sprzedaży detalicznej może zapytać: „Jakie były nasze najlepsze kategorie produktów w ostatnim kwartale i jakie czynniki przyczyniły się do ich sukcesu?”. Regionalni specjaliści ds. łańcucha dostaw w BMW Group, globalnym producencie samochodów i motocykli klasy premium, korzystają z generatywnego asystenta AI Amazon Q w QuickSight, aby szybko reagować na zapytania dotyczące widoczności łańcucha dostaw od starszych interesariuszy, takich jak członkowie zarządu.

Dane mają moc wpływania na zmiany - ale wymaga to atrakcyjnej narracji. Generatywna sztuczna inteligencja może sprawić, że praca z danymi będzie łatwa i przyjemna, tworząc atrakcyjne wizualnie dokumenty i prezentacje, które ożywiają dane.

Dodatkową korzyścią jest to, że może pomóc ludziom w całej organizacji lepiej zapoznać się z danymi i ich interpretacją, dzięki czemu dane są jeszcze bardziej wartościowe i przydatne w bardziej złożonych aplikacjach AI.

Dane syntetyczne: Uzyskaj pożądane dane

W miarę jak przedsiębiorstwa stają się coraz bardziej dojrzałe w zakresie analityki i sztucznej inteligencji, okazuje się, że nie mają wszystkich danych potrzebnych do nowych przypadków użycia, które sobie wyobrażają. Pozyskiwanie danych od osób trzecich może być zbyt kosztowne. W branżach regulowanych, takich jak opieka zdrowotna i usługi finansowe, gdzie prywatność i bezpieczeństwo danych są najważniejsze, wykorzystanie rzeczywistych danych klientów może być niemożliwe. Dane wymagane do testowania przypadków brzegowych w procesach biznesowych są często ograniczone.

Do testowania, szkolenia i innowacji można wykorzystać generowane przez sztuczną inteligencję syntetyczne dane o wysokiej wierności. Naśladują one właściwości statystyczne i wzorce rzeczywistych zbiorów danych, jednocześnie zachowując prywatność i eliminując wrażliwe informacje. Można ich również użyć do rozszerzenia danych do szkolenia modeli sztucznej inteligencji, gdy dane są ograniczone lub wrażliwe. Kadra kierownicza może wykorzystywać dane syntetyczne do planowania scenariuszy w celu modelowania różnych sytuacji biznesowych i testowania strategii łagodzenia i ograniczania ryzyka. Merck, globalna firma farmaceutyczna, wykorzystuje dane syntetyczne i usługi AWS w celu zmniejszenia liczby fałszywych odrzuceń w procesie kontroli leków. Zmniejszyli współczynnik fałszywych odrzuceń o 50 procent, opracowując syntetyczne dane obrazów wad za pomocą narzędzi takich jak generatywne sieci przeciwstawne (modele głębokiego uczenia, które stawiają przeciwko sobie dwie sieci neuronowe w celu wygenerowania nowych danych syntetycznych) i wariacyjne autoenkodery (generatywne sieci neuronowe, które kompresują dane do zwartej reprezentacji, a następnie rekonstruują je, ucząc się generować nowe dane w tym procesie).

Dane syntetyczne generowane przez sztuczną inteligencję mogą uwolnić innowacje i pomóc w tworzeniu zachwycających doświadczeń klientów. Amazon One to szybka i wygodna usługa, która pozwala klientowi dokonać płatności, okazać kartę lojalnościową, zweryfikować swój wiek lub wejść do lokalu, używając tylko dłoni. Amazon potrzebował dużego zbioru danych obrazów dłoni do szkolenia systemu, w tym zmian oświetlenia, pozycji dłoni i warunków, takich jak obecność bandaża. Korzystając z syntetycznych danych wygenerowanych przez sztuczną inteligencję, zespół przeszkolił nawet system do wykrywania bardzo szczegółowych silikonowych replik dłoni. Klienci skorzystali już z Amazon One ponad trzy miliony razy z dokładnością 99,9999 procent.

Sztuczna inteligencja i dane jako symbioza

Te trzy przykłady pokazują, w jaki sposób można wykorzystać generatywną sztuczną inteligencję do uwolnienia potencjału danych, szybszego wydobywania wartości i demonstrowania wymiernych korzyści z generatywnej sztucznej inteligencji. Od automatyzacji żmudnych zadań integracji danych po wzmocnienie pozycji użytkowników biznesowych dzięki analityce konwersacyjnej, generatywna sztuczna inteligencja może pomóc zespołom pracować mądrzej, a nie ciężej. A generując syntetyczne dane do testowania i innowacji, można napędzać nowe pomysły i możliwości, które wcześniej były poza zasięgiem. Zaskakującym kluczem jest nie tylko postrzeganie danych jako paliwa dla generatywnej sztucznej inteligencji, ale także generatywnej sztucznej inteligencji jako potężnego nowego narzędzia, które można zastosować do danych. - Ishit

Jak opublikowano w Analytics India Magazine - https://analyticsindiamag.com/ai-highlights/fuel-your-data-with-generative-ai/

 

Źródło: AWS

Case Studies
Referencje

Hostersi zrealizowali usługi konsultingowe z zakresu doboru odpowiedniej bazy danych w Amazon Web Services oraz pomyślnie przeprowadzili migrację bazy danych MySQL do Amazon Aurora. 

Tomasz Ślązok
CTO Landingi
W skrócie o nas
Specjalizujemy się w dostarczaniu rozwiązań IT w obszarach projektowania infrastruktury serwerowej, wdrażania chmury obliczeniowej, opieki administracyjnej i bezpieczeństwa danych.