https://sellio.store/pl/page/64/     https://fashionetta.org/pl/page/64/     https://home-partner.org/pl/page/64/     https://car-paradise.org/pl/page/64/     https://car-accessories.net/pl/page/64/     https://modeo-shop.com/pl/page/64/     https://wibratory.net/pl/page/64/     https://etui-empire.com/pl/page/64/     https://e-papierosy.org/pl/page/64/     https://ero-land.org/pl/page/64/     https://lampy-sklep.com/pl/page/64/     https://desteo.org/pl/page/64/     https://shopara.org/pl/page/64/     https://shopme-online.org/pl/page/64/     https://shopinio.org/pl/page/64/     https://shopopolis.org/pl/page/64/     https://shoporama.org/pl/page/64/     https://desuto.org/pl/page/64/     https://shopsy-online.org/pl/page/64/     https://e-shopsy.org/pl/page/64/     https://vandershop.net/pl/page/64/    https://home-trends.info/    https://moto-geek.info/en/

websites-info.com

Kolejna witryna oparta na WordPressie

Grafy wiedzy: Kontekst, Zgodność i Powiązania

„Graf pozostawia po sobie coraz większy ślad. I to jest dobre”, powiedział Thomas Frisendal w Knowledge Graphs and Data Modeling. Gartner określił grafy wiedzy jako część wyłaniającego się trendu w kierunku cyfrowych ekosystemów, pokazujących związki pomiędzy przedsiębiorstwami, ludźmi i rzeczami oraz umożliwiających płynne, dynamiczne połączenia w różnych regionach geograficznych i branżach.

Elisa Kendall i Deborah McGuinness, prezentując na konferencji DATAVERSITY® Data Architecture Online Conference, podzieliły się przypadkami użycia i niektórymi argumentami stojącymi za coraz szerszym wykorzystaniem grafów wiedzy. Kendall jest partnerem w Thematix Partners, a McGuinness jest dyrektorem generalnym McGuinness Associates Consulting oraz profesorem informatyki i kognitywistyki w Rensselaer Polytechnic Institute.

SZKOLENIE ONLINE NA ŻYWO: MODELOWANIE DANYCH DOGŁĘBNE

Dołącz do nas na trzydniowe, dogłębne warsztaty poświęcone fundamentalnym elementom Modelowania Danych.

Pochodzenie grafów wiedzy

Według Lisy Ehrlinger i Wolframa Woess’a w Towards a Definition of Knowledge Graphs by the Institute for Application Oriented Knowledge Processing, termin „graf wiedzy” powstał w latach 80-tych, kiedy to naukowcy z Uniwersytetu w Groningen i Uniwersytetu Twente w Holandii użyli go do formalnego opisu systemu, który reprezentował język naturalny poprzez integrację wiedzy z różnych źródeł.

Termin ten wszedł do szerszego użycia w 2012 roku, kiedy to Google użył go do opisania procesu wyszukiwania obiektów świata rzeczywistego, a nie ciągów znaków. Inne firmy, takie jak Yahoo i Bing, podążyły za tym przykładem, a jego zastosowanie w wyszukiwarkach trwa do dziś.

Wyszukiwarki zbierają informacje o użytkowniku w całym strumieniu kliknięć, a następnie kodują je w grafie wiedzy, dzięki czemu silnik może dostarczać lepsze kontekstowe odpowiedzi. Choć nie zawsze jest to idealne dopasowanie, po wzbogaceniu o metadane, dane z czujników, wideo, informacje o lokalizacji i zebrane dane analityczne o użytkownikach, którzy według nich są podobni, trafność jest znacznie zwiększona.

Terminologia: Grafy Wiedzy, Bazy Danych i Ontologia

Kendall wprowadził trzy kluczowe pojęcia związane z wykorzystaniem grafów wiedzy:

Ontologia to konceptualny model jakiegoś obszaru zainteresowania lub dyskursu. To:

  • Reprezentuje elementarne koncepcje krytyczne dla danej dziedziny
  • Zazwyczaj zawiera definicje i relacje, a nie rzeczywiste elementy lub instancje danych
  • Może zapewnić użytkownikom lokalny dostęp do wspólnej, znormalizowanej terminologii z jednoznacznymi definicjami.

Baza wiedzy jest trwałym repozytorium metadanych reprezentujących osoby, fakty i reguły dotyczące tego, jak są one powiązane ze sobą (graf wiedzy). Może zawierać ontologię lub być utrzymywana oddzielnie.

Graf wiedzy łączy współpracowników, wiedzę zdobytą ad hoc i przepływy pracy:

  • Zapewnia integrację repozytorium źródłowych zbiorów danych, kodu przepływu pracy analitycznej, wyników i publikacji.
    • Umożliwia możliwości wyszukiwania rozszerzone o wiedzę

Ontologie

Chociaż możliwe jest wykorzystanie Data Science i uczenia maszynowego do wyodrębnienia elementów niezbędnych do stworzenia ontologii, Kendall powiedział, że nie jest to takie proste przy dzisiejszych ogromnych magazynach danych:

„Aby znaleźć igłę w stogu siana, lub aby faktycznie móc ponownie wykorzystać zestawy treningowe, lub wykorzystać jakąkolwiek wiedzę pochodzącą z samej organizacji, to co naprawdę chcesz zrobić, to najpierw mieć dostęp do tego, co wydaje się być globalnym lub rozproszonym wykresem, tak aby wyglądało to spójnie.”

Wynik końcowy może wyglądać jak jedno źródło dla naukowców, ale w rzeczywistości wykorzystuje wiele protokołów, wiele rodzajów baz danych, różne słownictwo i różne założenia, które są bardzo rozproszone w ich domenie, powiedziała.

Przypadek użycia: Wyzwania związane z globalnym łańcuchem dostaw

Duży producent farmaceutyczny, z którym współpracowała Kendall, wykorzystywał uczenie maszynowe do zarządzania zdarzeniami w łańcuchu dostaw, takimi jak niezadowalające tolerancje surowców, opóźnienia statków spowodowane monsunami lub opóźnienia w produkcji w systemie just-in-time. Większość ich baz danych była ustrukturyzowana, ale zawierała również pola w bazie danych napisane w języku naturalnym, z użyciem żargonu opisującego surowce, pogodę lub inne komentarze, które były używane do opisania przyczyn każdego incydentu. Algorytmy maszynowe nie wiedziały, jak radzić sobie z tymi polami, więc Kendall opracował ontologię, która obejmowała wszystkie chemikalia, surowce, dostawców i procesy w zakładach produkcyjnych.

Firma była następnie w stanie rozszerzyć to, co już wiedziała z ogólnego uczenia maszynowego i reprezentacji przetwarzania języka naturalnego (NLP) o tę niestandardową ontologię, aby uzyskać lepsze raportowanie. Jak powiedziała, istnieje rosnące zapotrzebowanie na tego typu hybrydowe rozwiązania, w których kontrolowane słowniki są dodawane do istniejących standardowych ontologii, a także rosnące zapotrzebowanie na bardziej niestandardowe prace.

Niestandardowe ontologie umożliwiają większym firmom korzystanie ze znacznie bogatszego i bardziej adekwatnego zestawu terminów i zapytań oraz dokładniejsze opisywanie swoich produktów i usług na potrzeby raportowania, zgodności z przepisami lub aplikacji wspomagających podejmowanie decyzji.

Przypadek użycia: Historia tuńczyka

W swojej najprostszej formie, graf wiedzy może połączyć konsumenta z historią produktu. Kendall pokazał, w jaki sposób Bumble Bee Tuna daje klientom możliwość prześledzenia pochodzenia tuńczyka w zakupionej przez nich puszce do dokładnego miejsca, w którym pływał, jak i kiedy został złowiony, nazwę statku, sposób jego przetworzenia oraz lokalizację fabryki konserw.

Na stronie Trace My Catch firmy Bumble Bee klienci mogą wprowadzić kod znajdujący się na spodzie puszki tuńczyka, łososia lub innego produktu Bumble Bee, a strona wyświetla wszystkie informacje o zawartości tej konkretnej puszki. Jeśli chodzi o zrozumienie, co wpłynęło na produkt w całym łańcuchu żywnościowym, powiedziała: „To tylko wierzchołek góry lodowej.” Implikacje dla bezpieczeństwa żywności są znaczące, z których nie najmniej ważną jest umożliwienie szybszego opanowania sytuacji w przypadku zanieczyszczenia lub innego zagrożenia bezpieczeństwa żywności.

Przypadek użycia: Zgodność z przepisami po kryzysie

W ostatnich latach agencje regulacyjne na całym świecie wdrożyły środki mające na celu skorygowanie problemów, które doprowadziły do kryzysu finansowego z 2008 r., a organizacje finansowe miały trudności z zachowaniem zgodności. Kendall przytoczył grupę 30 banków podlegających zasadom ustalonym przez Komisję Bankową Unii Europejskiej, a tylko pięć z nich było w stanie spełnić wymagania ustalone na 2016 r. W kolejnych rocznych analizach banki nie tylko nie spełniły tych standardów, ale od raportu, który ukazał się w tym roku, nie podjęły żadnych starań, aby to zrobić, zasadniczo oddalając się jeszcze bardziej od zgodności, powiedział Kendall:

„Nie mogli wdrożyćz zasad, które były wymagane przez te przepisy, głównie z powodu problemów z architekturą danych, zarządzaniem danymi, zarządzaniem danymi, pochodzeniem danych i związaną z tym infrastrukturą IT”.

Wspólne punkty problemowe

Kendall opisał wyzwania związane ze zgodnością z regulacjami prawnymi, przed którymi stoją analitycy w organizacjach posiadających wiele różnych magazynów i hurtowni danych, gdzie uzyskanie niezbędnych informacji wymaga zależności od wielu osób, działów i źródeł danych, z których nie wszystkie są zautomatyzowane. Dane są często pobierane do wielu arkuszy kalkulacyjnych Excel – wszystkie potencjalne punkty awarii znajdujące się na biurku jakiejś osoby – „i nie daj Boże, jeśli ta osoba zostanie potrącona przez ciężarówkę”, powiedziała.

Wyzwanie polega nie tylko na tym, że dane nie są dobrze zarządzane, ale również na tym, że sami analitycy nie potrafią nawet ze sobą sensownie rozmawiać. W jednym przypadku bank miał 11 różnych definicji wspólnego terminu w całej organizacji, głównie dlatego, że 11 różnych systemów definiowało go w różny sposób.

Nowe spostrzeżenia dzięki grafom wiedzy

Kendall powiedział, że aby uzyskać odpowiedzi, które są potrzebne do spełnienia wymogów prawnych, biznes musi wziąć odpowiedzialność za strategię i zarządzanie danymi, jak również współodpowiedzialność z IT za jakość danych i operacje.

Graf wiedzy może pomóc poprzez łączenie i integrowanie silosów przy użyciu terminologii pochodzącej z architektury biznesowej, zapewniając bardziej elastyczne środowisko i szybsze odpowiedzi, przy jednoczesnym zachowaniu istniejącej technologii. Jednocześnie pozwala to na ponowne wykorzystanie globalnych standardów i dostosowanie źródeł danych w oparciu o znaczenie pojęć w każdym ze źródeł.

Przypadek użycia: Mapowanie danych do znaczeń

Aby zilustrować, w jaki sposób graf wiedzy może zapewnić pomost od danych do znaczenia, McGuinness pokazała przypadek użycia grafu wiedzy, który stworzyła dla Repozytorium Analiz Narażenia Zdrowia Dziecka (CHEAR). Celem tego programu jest badanie wpływu predyspozycji genetycznych i narażenia środowiskowego w dzieciństwie na wyniki zdrowotne.

Dane pacjentów z National Health and Nutrition Examination Survey (NHANES), dane genomowe z National Cancer Institute’s Genomic Data Commons (GDC) oraz dane z programu Surveillance, Epidemiology, and End Results (SEER) zostały połączone z dużymi, istniejącymi źródłami wiedzy na temat zdrowia, przy użyciu NLP i półautomatycznego mapowania. W rezultacie biostatystycy byli w stanie wykorzystać większą próbę populacji poprzez połączenie wielu badań, co pozwoliło im wyciągnąć bardziej znaczące wnioski.

NLP i automatyzacja umożliwiają powszechne stosowanie

Chociaż praktyka używania grafów do przedstawiania wiedzy jest znana od wielu dekad, McGuinness powiedział, że ostatni rozwój technologii przetwarzania języka naturalnego sprawił, że stała się ona dostępna dla znacznie szerszego grona odbiorców. Firmy używają grafów wiedzy znacznie bardziej efektywnie niż dekadę temu, powiedziała.

Zautomatyzowane techniki, gdy są odpowiednio połączone i wykorzystane z właściwym przypadkiem użycia, mogą zapewnić skuteczny sposób na zbudowanie czegoś skalowalnego, a grafy wiedzy mogą sprawić, że będzie jasne, gdzie wszystkie elementy pasują, ale „Kluczowe jest zrozumienie, co oznaczają twoje terminy”. Ważne jest również, aby znać wiarygodność treści.

W skali skali, ręczna kuratyzacja jest niemożliwa, więc konieczne jest poleganie na automatycznych i półautomatycznych podejściach. „Staje się to krytyczne w tym wrażliwym na czas i bardzo wpływowym

sytuacji decyzyjnej, aby naprawdę zrozumieć, gdzie znajduje się ta treść i kiedy ma sens powiązanie jej ze sobą.”

Chcesz dowiedzieć się więcej o nadchodzących wydarzeniach DATAVERSITY? Sprawdź naszą aktualną linię konferencji online i face-to-face tutaj.

Poniżej znajduje się wideo z prezentacji Data Architecture Online

:

Zdjęcie wykorzystane na licencji Shutterstock.com



Czytaj dalej: https://www.dataversity.net/knowledge-graphs-context-compliance-and-connections/

Related Posts

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.