18.06, Webinar ENFrom SQL scripts to production data platform on AWS
Rozwiązania

Health data & AI platform

Bezpieczna, interoperacyjna platforma w chmurze AWS, zaprojektowana z myślą o środowiskach badawczych. Wspiera analitykę kliniczną, badania naukowe oraz rozwój rozwiązań AI/ML opartych na danych medycznych.

Źródła danych

  • HIS
  • LIS / RIS
  • PACS
  • Biobanki

Health data & AI platform

Platforma danych
  • Walidacja
  • Pseudonimizacja
  • Anonimizacja
  • HL7 FHIR
  • OMOP CDM
  • Terminologie medyczne
  • FHIR Server
  • Selekcja kohort
Środowiska badawcze
  • Badanie populacjiProjekt 1
  • Analizy biostatystyczneProjekt 2
  • Obrazowanie AIProjekt N+1
  • Modele AI/ML
  • Compute + storage
  • Disaster Recovery
  • Kontrola kosztów

Użytkownicy

  • Badacze
  • Analitycy
  • Zespoły IT
Wyzwania

Uwarunkowania współczesnych badań medycznych

Platforma stanowi odpowiedź na rosnącą złożoność prowadzenia badań w uczelniach, instytutach oraz centrach klinicznych. Znosi bariery techniczne, prawne i organizacyjne, wspiera zarządzanie kosztami na poziomie projektów i zespołów badawczych oraz zapewnia zgodność z regulacjami i standardami interoperacyjności (RODO, EHDS).

  • Rozproszenie i brak standaryzacji danych

    Dane medyczne pochodzą z wielu systemów (HIS, PACS, LIS, biobanki) i występują w różnych formatach, co utrudnia ich integrację, analizę i wykorzystanie w badaniach.

  • Ograniczona interoperacyjność między ośrodkami

    Brak wspólnych standardów i spójnych mechanizmów wymiany danych w systemach HIS utrudnia współpracę pomiędzy jednostkami oraz realizację badań wieloośrodkowych.

  • Trudność w przygotowaniu danych do badań

    Przekształcanie danych surowych do postaci analitycznej (np. kohort) jest czasochłonne, wymaga specjalistycznych kompetencji i często odbywa się poza kontrolowanym środowiskiem.

  • Wysokie wymagania regulacyjne

    Przetwarzanie danych zdrowotnych wymaga spełnienia rygorystycznych wymogów (RODO, EHDS), w tym zapewnienia bezpieczeństwa, kontroli dostępu oraz pełnej audytowalności operacji.

  • Ryzyka formalne i brak audytowalności

    Wymagania regulacyjne oraz brak mechanizmów anonimizacji i śledzenia dostępu utrudniają zapewnienie zgodności i bezpieczeństwa danych.

  • Zmienność krajobrazu regulacyjnego

    Pojawianie się nowych aktów prawnych (EHDS, AI Act) oraz rekomendacji ABM wymaga ciągłej adaptacji procedur i infrastruktury — bez gotowych mechanizmów każda zmiana oznacza kosztowny projekt dostosowawczy.

  • Ograniczony dostęp do skalowalnych zasobów obliczeniowych

    W tradycyjnych środowiskach on-prem analiza dużych zbiorów danych — szczególnie obrazowych i genomowych — wymaga kosztownej i trudnej w utrzymaniu infrastruktury.

  • Czasochłonne przygotowanie środowiska i danych

    Brak powtarzalności powoduje, że każdy projekt wymaga odrębnego przygotowania postępowań (PZP), zakupu infrastruktury oraz ręcznego przygotowania danych.

  • Trudność budowy kohort pacjentów

    Bez nowoczesnych narzędzi tworzenie kohort o odpowiedniej liczebności, jakości danych i spójności jest czasochłonne i niewydajne.

Fundament technologiczny

Natywne usługi medyczne i ekosystem AI

Trzy dedykowane usługi AWS dla danych medycznych stanowią kręgosłup platformy. Wokół nich pracuje ekosystem narzędzi AI/ML — od modeli podstawowych po specjalistyczne modele medyczne.

AWS HealthLake - logo

AWS HealthLake

FHIR

Serwer FHIR z wbudowanym Data Lakehouse do analityki SQL i eksportu danych. Interfejs zgodny ze standardem FHIR API umożliwia definiowanie i przeszukiwanie kohort pacjentów bezpośrednio na danych klinicznych.

AWS HealthImaging - logo

AWS HealthImaging

DICOM / DICOMweb

Repozytorium obrazów medycznych DICOM. Skalowalna warstwa składowania, natywne API DICOMweb, integracja z istniejącą infrastrukturą PACS. Interaktywny interfejs umożliwia przeglądanie obrazów zgodnie z rolami dostępowymi.

AWS HealthOmics - logo

AWS HealthOmics

FASTQ / BAM / CRAM

Warstwa składowania i przetwarzania danych genomicznych i omicznych. Umożliwia przechowywanie, przetwarzanie oraz analizę danych sekwencjonowania w ramach jednej platformy.

Ekosystem AI/ML w chmurze AWS

AmazonSageMaker
Trenowanie własnych modeli
  • PyTorchFramework
  • TensorFlowFramework
  • Hugging FaceModel hub
  • XGBoostKlasyczny ML
  • scikit-learnKlasyczny ML
  • MLFlowExperiment tracking
AmazonBedrock
Gotowe modele podstawowe
  • ClaudeAnthropic
  • NovaAmazon
  • LlamaMeta
  • DeepSeekDeepSeek
  • QwenAlibaba
  • GPT OSSOpenAI

Zarządzanie kosztami w modelu pay-as-you-go

Pełna transparentność kosztów na poziomie projektu badawczego, zespołu i zasobu. Mechanizmy budżetowe, raportowe i alerty pozwalają kontrolować wydatki i unikać nadmiarowych kosztów.

Wydatki projektowe · maj 202623 850 PLN
  • Badanie populacji72%
    10 800 / 15 000 PLN
  • Analizy biostatystyczne94%
    9 400 / 10 000 PLN · Alert ≥ 80%
  • Obrazowanie AI43%
    3 650 / 8 500 PLN
  • Budżety
  • Raporty
  • Alerty

Skalowalna infrastruktura

Elastyczna infrastruktura umożliwiająca pracę na dużych wolumenach danych (DICOM, OMOP, genomika) oraz uruchamianie zaawansowanych obliczeń i modeli AI. Zasoby są dostępne na żądanie — od pojedynczych analiz po projekty wieloośrodkowe.

Skalowanie na żądanie
Jeden projekt badawczyWieloośrodkoweWiele projektówGPUObliczeniaDyskSieć
Korzyści

Konkretne efekty dla instytucji i zespołów badawczych

Dla instytucji

  • Krótszy czas realizacji projektów badawczych
  • Redukcja kosztów operacyjnych — jedna platforma zamiast silosów
  • Gotowość na programy badawcze krajowe i europejskie
  • Gotowość do spełnienia wymogów HIPAA oraz ISO 27001

Dla zespołów badawczych

  • Szybszy dostęp do wiarygodnych, gotowych do analizy danych
  • Powtarzalność i transparentność wyników
  • Bezpieczne środowisko innowacji z gotowymi narzędziami
  • Badania wieloośrodkowe bez barier technicznych
  • Skrócenie drogi od hipotezy do opublikowanych wyników
Zgodność regulacyjna

Bezpieczeństwo i compliance jako element architektury

Platforma zaprojektowana dla środowisk regulowanych — zgodna z przepisami prawa krajowego i unijnego.

RODO / GDPR

Ochrona danych osobowych

Pseudonimizacja, anonimizacja, zarządzanie zgodami i ścieżki audytu zgodne z unijnym rozporządzeniem o ochronie danych osobowych.

EHDS

European Health Data Space

Zgodność z rozporządzeniem o europejskiej przestrzeni danych zdrowotnych — fundament dla projektów europejskich i transgranicznych badań klinicznych.

ABM / RCMC

Rekomendacje Agencji Badań Medycznych

Zgodność z rekomendacjami ABM w zakresie Rejestrów Chorób i Danych Medyczno-Klinicznych na rynku polskim. Platforma realizuje cele Regionalnych Centrów Medycyny Cyfrowej.

HL7 FHIR

Interoperacyjność systemów

Dwukierunkowa integracja z systemami HIS i zewnętrznymi ośrodkami zgodna z międzynarodowym standardem wymiany danych klinicznych.

OMOP CDM

Dane obserwacyjne

Dane kliniczne z codziennej praktyki (RWD) zmapowane do OMOP CDM, umożliwiające uczestnictwo w międzynarodowych badaniach obserwacyjnych.

HIPAA · ISO 27001

Standardy bezpieczeństwa

Gotowość do spełnienia wymogów HIPAA (USA) oraz systemów zarządzania bezpieczeństwem informacji zgodnych z ISO 27001.

Scenariusze użycia

Od pomysłu badawczego do opublikowanych wyników

Platforma wspiera szeroki zakres projektów w obszarze medycyny cyfrowej.

Wieloośrodkowe badania kliniczne

Prowadzenie badań na kohortach pacjentów z wielu ośrodków bez fizycznego transferu danych wrażliwych. Zunifikowane środowisko zapewnia powtarzalność i audytowalność wymaganą przez EHDS i RODO.

  • Współpraca wieloośrodkowa
  • Powtarzalność wyników
  • Audytowalność operacji

Analizy populacyjne i epidemiologiczne

Tworzenie kohort i analiza wzorców zdrowotnych w populacjach — dane z rejestrów, systemów HIS i zewnętrznych źródeł są dostępne w jednym ekosystemie analitycznym, z pełną kontrolą dostępu i wersjonowaniem zbiorów.

  • Budowa kohort
  • Wersjonowanie zbiorów
  • Dane z codziennej praktyki

AI wspomagające diagnostykę

Budowanie, trenowanie i walidowanie modeli AI na danych klinicznych i obrazowych. Katalog gotowych algorytmów i wbudowane środowisko adnotacji DICOM skracają drogę od surowych danych do gotowego modelu.

  • Trenowanie modeli
  • Adnotacja danych
  • Walidacja kliniczna

Zaawansowana analiza obrazów medycznych

Natywna obsługa obrazów DICOM z możliwością segmentacji, adnotacji i trenowania modeli bezpośrednio w izolowanym środowisku projektowym — bez eksportu danych poza platformę.

  • Segmentacja obrazów
  • Adnotacja DICOM
  • Izolowane środowisko
Kluczowe możliwości

Kompleksowe wsparcie całego cyklu badawczego

Integracja i interoperacyjność

Praca na pełnym obrazie danych medycznych

  • Integracja danych ze wszystkich systemów szpitalnych,
  • Konwersja danych ze źródeł szpitalnych do standardów FHIR i OMOP CDM wraz z mapowaniem terminologii medycznych (ICD-9, ICD-10, SNOMED CT, LOINC),
  • Obsługa danych obrazowych DICOM w dedykowanym środowisku z dostępem do narzędzi anotacyjnych oraz przeglądarek diagnostycznych,
  • Łączenie danych klinicznych, rejestrowych, genomicznych i obrazowych w jednym spójnym modelu badawczym,
  • Interoperacyjność oparta na uznanych standardach FHIR i OMOP, umożliwiająca bezpieczną wymianę danych pomiędzy ośrodkami badawczymi i szpitalami.
Analityka i AI

Zaawansowane analizy oraz budowa modeli AI bez barier technicznych i regulacyjnych

  • Bezpieczne środowiska analityczne do budowy raportów BI, modeli predykcyjnych i agentów AI działających na danych klinicznych,
  • Szybka weryfikacja wykonalności badania poprzez natychmiastowy dostęp do danych i ocenę liczebności kohorty,
  • Wsparcie anotacji danych obrazowych i tekstowych na potrzeby trenowania modeli AI,
  • Dostęp do najnowszych modeli AI gotowych do zastosowania w badaniach naukowych i analizach klinicznych,
  • Eksploracyjna analiza danych przed formalnym rozpoczęciem projektu badawczego, umożliwiająca ocenę potencjału i ryzyk badawczych,
  • Automatyzacja pipeline'ów i powoływania środowisk AI/ML.
Zarządzanie danymi badawczymi

Wiarygodne, uporządkowane i gotowe do wielokrotnego wykorzystania dane

  • Architektura Data Lakehouse obsługująca różnorodne typy danych medycznych - od ustrukturyzowanych rekordów po obrazy diagnostyczne,
  • Szybkie wyszukiwanie pacjentów i budowa kohort badawczych w oparciu o kryteria kliniczne, demograficzne i czasowe,
  • Wersjonowanie zbiorów danych zapewniające powtarzalność wyników i możliwość porównywania kolejnych iteracji badań,
  • Katalog danych badawczych z opisem zawartości, jakości i ograniczeń każdego zbioru.
Współpraca i nadzór

Wiele zespołów i projektów, jeden ekosystem

  • Precyzyjne role i uprawnienia (RBAC) dopasowane do funkcji badawczych, analitycznych i administracyjnych,
  • Pełna izolacja projektów badawczych zapewniająca bezpieczeństwo danych, audytowalność operacji i niezależność prowadzonych prac,
  • Rejestracja zgód pacjentów oraz ścieżek wykorzystania danych zgodnie z wymogami formalnymi i protokołami badawczymi,
  • Centralne zarządzanie cyklem życia projektu badawczego - od wniosku po publikację wyników.
Ochrona prywatności

Dane wrażliwe pod ścisłą ochroną

  • Pseudonimizacja i anonimizacja danych osobowych realizowane automatycznie na etapie ich pozyskiwania,
  • Dane wrażliwe niedostępne w postaci surowej bez odpowiednich uprawnień nadanych zgodnie z jasną określoną procedur,
  • Mechanizmy ograniczające możliwość identyfikacji pacjentów na podstawie wyników analiz i raportów,
  • Ścisła kontrola dostępu do danych z pełną audytowalnością każdej operacji odczytu, modyfikacji i eksportu,
  • Środowiska analityczne zaprojektowane tak, aby dane nie opuszczały bezpiecznej infrastruktury platformy.
Zgodność regulacyjna

Compliance wbudowany w platformę

  • Spełnienie wymogów RODO oraz krajowych i unijnych przepisów dotyczących przetwarzania danych medycznych,
  • Pełna rozliczalność dostępu do danych oraz operacji wykonywanych w toku badań,
  • Kontrola lokalizacji przetwarzania i suwerenności danych zgodnie z wymogami prawa krajowego i unijnego,
  • Gotowość na European Health Data Space (EHDS) oraz wdrażanie dobrych praktyk i wytycznych dla badań medycznych, w tym rekomendacji Agencji Badań Medycznych,
  • Wsparcie procesów akceptacji i udostępniania danych do badań zgodnie z politykami instytucji badawczych.
Model wdrożenia

Wdrożenie dopasowane do potrzeb Twojej instytucji

Podejście etapowe minimalizuje ryzyko i pozwala walidować wartość platformy przed pełną implementacją.

Pilotaż i ocena gotowości

Analiza istniejących źródeł danych, architektury IT i wymagań regulacyjnych. Zbudowanie business case'u i planu wdrożenia dopasowanego do Twojej instytucji.

Wdrożenie i integracja

Uruchomienie platformy w chmurze publicznej lub suwerennej, integracja z istniejącą infrastrukturą (HIS, PACS, laboratoria), konfiguracja ról i uprawnień.

Skalowanie i utrzymanie

Platforma rośnie razem z Twoimi potrzebami. Rozszerzenie na kolejne projekty i ośrodki. Możliwość utrzymania wspólnego lub zarządzanego.


FAQ

Czym jest Wirtualne Środowisko Badawcze i czemu służy izolacja projektów?

Wirtualne Środowisko Badawcze to dedykowana przestrzeń obliczeniowa tworzona na potrzeby konkretnego projektu badawczego, uruchamiana na wniosek badacza po akceptacji administratora platformy. Każde środowisko jest izolowane na trzech poziomach:

  • kosztowym — zasoby i ich zużycie są rozliczane odrębnie dla każdego projektu,
  • dostępowym — dostęp do danych i narzędzi jest kontrolowany zgodnie z przypisanymi rolami,
  • obliczeniowym — badania w ramach jednego projektu nie wpływają na wydajność ani wyniki innych projektów.

Dzięki temu różne zespoły badawcze mogą prowadzić równolegle niezależne projekty w ramach jednej platformy, bez ryzyka konfliktów w obszarze danych, uprawnień lub budżetów.

Jaka jest różnica między HL7 FHIR a OMOP CDM i które z nich stosuje platforma?

Platforma obsługuje i udostępnia zarówno format HL7 FHIR, jak i OMOP CDM, wykorzystując je komplementarnie.

HL7 FHIR pełni dwie role. Po pierwsze, zapewnia interoperacyjność z zewnętrznymi systemami, w tym systemami szpitalnymi, rejestrami krajowymi oraz inicjatywami takimi jak Europejska Przestrzeń Danych o Zdrowiu (EHDS). Po drugie, platforma udostępnia interfejs FHIR Search API, który umożliwia realizację zapytań statystycznych (np. określenie liczby pacjentów spełniających zadane kryteria) bez dostępu do danych jednostkowych — będąc interfejsem statystycznym dla zewnętrznych podmiotów. Odpowiedzi mają zawsze charakter agregacyjny i numeryczny.

OMOP CDM jest wspólnym modelem analitycznym rozwijanym przez OHDSI, do którego platforma konwertuje dane kliniczne. Standaryzacja w tym modelu umożliwia porównywanie wyników między ośrodkami oraz wykorzystanie gotowych narzędzi analitycznych zbudowanych przez społeczność badawczą.

Połączenie obu standardów daje realną wartość w Wirtualnym Środowisku Badawczym. Zdefiniowane kohorty pacjentów mogą być prezentowane zarówno w standardzie FHIR, jak i OMOP. Tym samym spełnione są zarówno wymagania interoperacyjności, jak i zapewniona jest zgodność z najlepszymi praktykami analityki badań klinicznych.

Czy badacz bez umiejętności programowania może korzystać z platformy?

Tak. Platforma udostępnia narzędzia no-code i low-code umożliwiające eksplorację danych oraz budowę modeli ML za pomocą interfejsu graficznego. Jednocześnie zaawansowani użytkownicy mają dostęp do pełnego środowiska Python i R. Oba podejścia mogą być stosowane równolegle w ramach jednego projektu, co umożliwia efektywną współpracę zespołów o zróżnicowanych kompetencjach.

Jak platforma skaluje zasoby obliczeniowe pod duże projekty badawcze?

Każde Wirtualne Środowisko Badawcze dysponuje indywidualnie konfigurowaną pulą zasobów obejmującą CPU, pamięć operacyjną, przestrzeń dyskową oraz w razie potrzeby dostęp do GPU wykorzystywanych m.in. w analizie obrazów i trenowaniu modeli.

Zasoby są skalowane dynamicznie — zwiększane w okresach intensywnych obliczeń oraz redukowane w przestojach, co zapewnia efektywne wykorzystanie infrastruktury i optymalizację kosztów operacyjnych projektu.

Jakie modele AI i ML są dostępne na platformie?

Platforma zapewnia środowisko do budowy modeli predykcyjnych, klasyfikacyjnych i regresyjnych, a także dostęp do pretrenowanych dużych modeli językowych wspierających język polski i terminologię medyczną. Dostępne są również narzędzia klasy AutoML umożliwiające automatyczny dobór i optymalizację modeli. Wytrenowane modele mogą być publikowane w postaci usług REST API, dostępnych dla innych systemów organizacji lub podmiotów zewnętrznych.

Jak działają pseudonimizacja i anonimizacja danych na platformie?

Dane wrażliwe (w tym dane pacjentów oraz dane obrazowe) są przetwarzane wyłącznie w postaci pseudonimizowanej lub — w zależności od potrzeb — anonimizowanej. Badacze pracują bezpośrednio na danych w ramach Wirtualnego Środowiska Badawczego bez dostępu do informacji umożliwiających identyfikację pacjentów. Wyniki analiz oraz definiowane kohorty są przygotowywane w sposób uniemożliwiający reidentyfikację osób.

Czy platforma obsługuje dane genomiczne i obrazy DICOM?

Tak. Platforma zapewnia natywną obsługę danych obrazowych DICOM, w tym możliwość ich segmentacji, adnotacji i trenowania modeli bezpośrednio w izolowanym środowisku projektowym. Obsługiwane są również dane genomiczne w formatach FASTQ, BAM i CRAM. Praca na tych typach danych odbywa się w całości w ramach platformy, bez konieczności ich eksportu poza platformę.

Zapraszamy do rozmowy

Nasi architekci pomogą dopasować platformę do potrzeb i specyfiki danej instytucji oraz ocenić jej gotowość do realizacji konkretnych scenariuszy użycia.