Rozwiązania

Health data & AI platform

Bezpieczna, interoperacyjna platforma w chmurze AWS, zaprojektowana z myślą o środowiskach badawczych. Wspiera analitykę kliniczną, badania naukowe oraz rozwój rozwiązań AI/ML opartych na danych medycznych.

Źródła danych

HIS
LIS / RIS
PACS
Biobanki

Health data & AI platform

Platforma danych

Walidacja
Pseudonimizacja
Anonimizacja
HL7 FHIR
OMOP CDM
Terminologie medyczne
FHIR Server
Selekcja kohort

Środowiska badawcze

Badanie populacjiProjekt 1
Analizy biostatystyczneProjekt 2
Obrazowanie AIProjekt N+1

Modele AI/ML
Compute + storage
Disaster Recovery
Kontrola kosztów

Użytkownicy

Badacze
Analitycy
Zespoły IT

Wyzwania

Uwarunkowania współczesnych badań medycznych

Platforma stanowi odpowiedź na rosnącą złożoność prowadzenia badań w uczelniach, instytutach oraz centrach klinicznych. Znosi bariery techniczne, prawne i organizacyjne, wspiera zarządzanie kosztami na poziomie projektów i zespołów badawczych oraz zapewnia zgodność z regulacjami i standardami interoperacyjności (RODO, EHDS).

Rozproszenie i brak standaryzacji danych
Dane medyczne pochodzą z wielu systemów (HIS, PACS, LIS, biobanki) i występują w różnych formatach, co utrudnia ich integrację, analizę i wykorzystanie w badaniach.
Ograniczona interoperacyjność między ośrodkami
Brak wspólnych standardów i spójnych mechanizmów wymiany danych w systemach HIS utrudnia współpracę pomiędzy jednostkami oraz realizację badań wieloośrodkowych.
Trudność w przygotowaniu danych do badań
Przekształcanie danych surowych do postaci analitycznej (np. kohort) jest czasochłonne, wymaga specjalistycznych kompetencji i często odbywa się poza kontrolowanym środowiskiem.

Wysokie wymagania regulacyjne
Przetwarzanie danych zdrowotnych wymaga spełnienia rygorystycznych wymogów (RODO, EHDS), w tym zapewnienia bezpieczeństwa, kontroli dostępu oraz pełnej audytowalności operacji.
Ryzyka formalne i brak audytowalności
Wymagania regulacyjne oraz brak mechanizmów anonimizacji i śledzenia dostępu utrudniają zapewnienie zgodności i bezpieczeństwa danych.
Zmienność krajobrazu regulacyjnego
Pojawianie się nowych aktów prawnych (EHDS, AI Act) oraz rekomendacji ABM wymaga ciągłej adaptacji procedur i infrastruktury — bez gotowych mechanizmów każda zmiana oznacza kosztowny projekt dostosowawczy.

Ograniczony dostęp do skalowalnych zasobów obliczeniowych
W tradycyjnych środowiskach on-prem analiza dużych zbiorów danych — szczególnie obrazowych i genomowych — wymaga kosztownej i trudnej w utrzymaniu infrastruktury.
Czasochłonne przygotowanie środowiska i danych
Brak powtarzalności powoduje, że każdy projekt wymaga odrębnego przygotowania postępowań (PZP), zakupu infrastruktury oraz ręcznego przygotowania danych.
Trudność budowy kohort pacjentów
Bez nowoczesnych narzędzi tworzenie kohort o odpowiedniej liczebności, jakości danych i spójności jest czasochłonne i niewydajne.

Fundament technologiczny

Natywne usługi medyczne i ekosystem AI

Trzy dedykowane usługi AWS dla danych medycznych stanowią kręgosłup platformy. Wokół nich pracuje ekosystem narzędzi AI/ML — od modeli podstawowych po specjalistyczne modele medyczne.

AWS HealthLake

FHIR

Serwer FHIR z wbudowanym Data Lakehouse do analityki SQL i eksportu danych. Interfejs zgodny ze standardem FHIR API umożliwia definiowanie i przeszukiwanie kohort pacjentów bezpośrednio na danych klinicznych.

AWS HealthImaging

DICOM / DICOMweb

Repozytorium obrazów medycznych DICOM. Skalowalna warstwa składowania, natywne API DICOMweb, integracja z istniejącą infrastrukturą PACS. Interaktywny interfejs umożliwia przeglądanie obrazów zgodnie z rolami dostępowymi.

AWS HealthOmics

FASTQ / BAM / CRAM

Warstwa składowania i przetwarzania danych genomicznych i omicznych. Umożliwia przechowywanie, przetwarzanie oraz analizę danych sekwencjonowania w ramach jednej platformy.

Ekosystem AI/ML w chmurze AWS

AmazonSageMaker

Trenowanie własnych modeli

PyTorchFramework
TensorFlowFramework
Hugging FaceModel hub
XGBoostKlasyczny ML
scikit-learnKlasyczny ML
MLFlowExperiment tracking

AmazonBedrock

Gotowe modele podstawowe

ClaudeAnthropic
NovaAmazon
LlamaMeta
DeepSeekDeepSeek
QwenAlibaba
GPT OSSOpenAI

Zarządzanie kosztami w modelu pay-as-you-go

Pełna transparentność kosztów na poziomie projektu badawczego, zespołu i zasobu. Mechanizmy budżetowe, raportowe i alerty pozwalają kontrolować wydatki i unikać nadmiarowych kosztów.

Wydatki projektowe · maj 202623 850 PLN

Badanie populacji72%
10 800 / 15 000 PLN
Analizy biostatystyczne94%
9 400 / 10 000 PLN · Alert ≥ 80%
Obrazowanie AI43%
3 650 / 8 500 PLN

Budżety
Raporty
Alerty

Skalowalna infrastruktura

Elastyczna infrastruktura umożliwiająca pracę na dużych wolumenach danych (DICOM, OMOP, genomika) oraz uruchamianie zaawansowanych obliczeń i modeli AI. Zasoby są dostępne na żądanie — od pojedynczych analiz po projekty wieloośrodkowe.

Skalowanie na żądanie

Jeden projekt badawczyWieloośrodkoweWiele projektówGPUObliczeniaDyskSieć

Korzyści

Konkretne efekty dla instytucji i zespołów badawczych

Dla instytucji

Krótszy czas realizacji projektów badawczych
Redukcja kosztów operacyjnych — jedna platforma zamiast silosów
Gotowość na programy badawcze krajowe i europejskie
Gotowość do spełnienia wymogów HIPAA oraz ISO 27001

Dla zespołów badawczych

Szybszy dostęp do wiarygodnych, gotowych do analizy danych
Powtarzalność i transparentność wyników
Bezpieczne środowisko innowacji z gotowymi narzędziami
Badania wieloośrodkowe bez barier technicznych
Skrócenie drogi od hipotezy do opublikowanych wyników

Zgodność regulacyjna

Bezpieczeństwo i compliance jako element architektury

Platforma zaprojektowana dla środowisk regulowanych — zgodna z przepisami prawa krajowego i unijnego.

RODO / GDPR

Ochrona danych osobowych

Pseudonimizacja, anonimizacja, zarządzanie zgodami i ścieżki audytu zgodne z unijnym rozporządzeniem o ochronie danych osobowych.

EHDS

European Health Data Space

Zgodność z rozporządzeniem o europejskiej przestrzeni danych zdrowotnych — fundament dla projektów europejskich i transgranicznych badań klinicznych.

ABM / RCMC

Rekomendacje Agencji Badań Medycznych

Zgodność z rekomendacjami ABM w zakresie Rejestrów Chorób i Danych Medyczno-Klinicznych na rynku polskim. Platforma realizuje cele Regionalnych Centrów Medycyny Cyfrowej.

HL7 FHIR

Interoperacyjność systemów

Dwukierunkowa integracja z systemami HIS i zewnętrznymi ośrodkami zgodna z międzynarodowym standardem wymiany danych klinicznych.

OMOP CDM

Dane obserwacyjne

Dane kliniczne z codziennej praktyki (RWD) zmapowane do OMOP CDM, umożliwiające uczestnictwo w międzynarodowych badaniach obserwacyjnych.

HIPAA · ISO 27001

Standardy bezpieczeństwa

Gotowość do spełnienia wymogów HIPAA (USA) oraz systemów zarządzania bezpieczeństwem informacji zgodnych z ISO 27001.

Scenariusze użycia

Od pomysłu badawczego do opublikowanych wyników

Platforma wspiera szeroki zakres projektów w obszarze medycyny cyfrowej.

Wieloośrodkowe badania kliniczne

Prowadzenie badań na kohortach pacjentów z wielu ośrodków bez fizycznego transferu danych wrażliwych. Zunifikowane środowisko zapewnia powtarzalność i audytowalność wymaganą przez EHDS i RODO.

Współpraca wieloośrodkowa
Powtarzalność wyników
Audytowalność operacji

Analizy populacyjne i epidemiologiczne

Tworzenie kohort i analiza wzorców zdrowotnych w populacjach — dane z rejestrów, systemów HIS i zewnętrznych źródeł są dostępne w jednym ekosystemie analitycznym, z pełną kontrolą dostępu i wersjonowaniem zbiorów.

Budowa kohort
Wersjonowanie zbiorów
Dane z codziennej praktyki

AI wspomagające diagnostykę

Budowanie, trenowanie i walidowanie modeli AI na danych klinicznych i obrazowych. Katalog gotowych algorytmów i wbudowane środowisko adnotacji DICOM skracają drogę od surowych danych do gotowego modelu.

Trenowanie modeli
Adnotacja danych
Walidacja kliniczna

Zaawansowana analiza obrazów medycznych

Natywna obsługa obrazów DICOM z możliwością segmentacji, adnotacji i trenowania modeli bezpośrednio w izolowanym środowisku projektowym — bez eksportu danych poza platformę.

Segmentacja obrazów
Adnotacja DICOM
Izolowane środowisko

Kluczowe możliwości

Kompleksowe wsparcie całego cyklu badawczego

Integracja i interoperacyjność

Praca na pełnym obrazie danych medycznych

Integracja danych ze wszystkich systemów szpitalnych,
Konwersja danych ze źródeł szpitalnych do standardów FHIR i OMOP CDM wraz z mapowaniem terminologii medycznych (ICD-9, ICD-10, SNOMED CT, LOINC),
Obsługa danych obrazowych DICOM w dedykowanym środowisku z dostępem do narzędzi anotacyjnych oraz przeglądarek diagnostycznych,
Łączenie danych klinicznych, rejestrowych, genomicznych i obrazowych w jednym spójnym modelu badawczym,
Interoperacyjność oparta na uznanych standardach FHIR i OMOP, umożliwiająca bezpieczną wymianę danych pomiędzy ośrodkami badawczymi i szpitalami.

Analityka i AI

Zaawansowane analizy oraz budowa modeli AI bez barier technicznych i regulacyjnych

Bezpieczne środowiska analityczne do budowy raportów BI, modeli predykcyjnych i agentów AI działających na danych klinicznych,
Szybka weryfikacja wykonalności badania poprzez natychmiastowy dostęp do danych i ocenę liczebności kohorty,
Wsparcie anotacji danych obrazowych i tekstowych na potrzeby trenowania modeli AI,
Dostęp do najnowszych modeli AI gotowych do zastosowania w badaniach naukowych i analizach klinicznych,
Eksploracyjna analiza danych przed formalnym rozpoczęciem projektu badawczego, umożliwiająca ocenę potencjału i ryzyk badawczych,
Automatyzacja pipeline'ów i powoływania środowisk AI/ML.

Zarządzanie danymi badawczymi

Wiarygodne, uporządkowane i gotowe do wielokrotnego wykorzystania dane

Architektura Data Lakehouse obsługująca różnorodne typy danych medycznych - od ustrukturyzowanych rekordów po obrazy diagnostyczne,
Szybkie wyszukiwanie pacjentów i budowa kohort badawczych w oparciu o kryteria kliniczne, demograficzne i czasowe,
Wersjonowanie zbiorów danych zapewniające powtarzalność wyników i możliwość porównywania kolejnych iteracji badań,
Katalog danych badawczych z opisem zawartości, jakości i ograniczeń każdego zbioru.

Współpraca i nadzór

Wiele zespołów i projektów, jeden ekosystem

Precyzyjne role i uprawnienia (RBAC) dopasowane do funkcji badawczych, analitycznych i administracyjnych,
Pełna izolacja projektów badawczych zapewniająca bezpieczeństwo danych, audytowalność operacji i niezależność prowadzonych prac,
Rejestracja zgód pacjentów oraz ścieżek wykorzystania danych zgodnie z wymogami formalnymi i protokołami badawczymi,
Centralne zarządzanie cyklem życia projektu badawczego - od wniosku po publikację wyników.

Ochrona prywatności

Dane wrażliwe pod ścisłą ochroną

Pseudonimizacja i anonimizacja danych osobowych realizowane automatycznie na etapie ich pozyskiwania,
Dane wrażliwe niedostępne w postaci surowej bez odpowiednich uprawnień nadanych zgodnie z jasną określoną procedur,
Mechanizmy ograniczające możliwość identyfikacji pacjentów na podstawie wyników analiz i raportów,
Ścisła kontrola dostępu do danych z pełną audytowalnością każdej operacji odczytu, modyfikacji i eksportu,
Środowiska analityczne zaprojektowane tak, aby dane nie opuszczały bezpiecznej infrastruktury platformy.

Zgodność regulacyjna

Compliance wbudowany w platformę

Spełnienie wymogów RODO oraz krajowych i unijnych przepisów dotyczących przetwarzania danych medycznych,
Pełna rozliczalność dostępu do danych oraz operacji wykonywanych w toku badań,
Kontrola lokalizacji przetwarzania i suwerenności danych zgodnie z wymogami prawa krajowego i unijnego,
Gotowość na European Health Data Space (EHDS) oraz wdrażanie dobrych praktyk i wytycznych dla badań medycznych, w tym rekomendacji Agencji Badań Medycznych,
Wsparcie procesów akceptacji i udostępniania danych do badań zgodnie z politykami instytucji badawczych.

Model wdrożenia

Wdrożenie dopasowane do potrzeb Twojej instytucji

Podejście etapowe minimalizuje ryzyko i pozwala walidować wartość platformy przed pełną implementacją.

Pilotaż i ocena gotowości

Analiza istniejących źródeł danych, architektury IT i wymagań regulacyjnych. Zbudowanie business case'u i planu wdrożenia dopasowanego do Twojej instytucji.

Wdrożenie i integracja

Uruchomienie platformy w chmurze publicznej lub suwerennej, integracja z istniejącą infrastrukturą (HIS, PACS, laboratoria), konfiguracja ról i uprawnień.

Skalowanie i utrzymanie

Platforma rośnie razem z Twoimi potrzebami. Rozszerzenie na kolejne projekty i ośrodki. Możliwość utrzymania wspólnego lub zarządzanego.

FAQ

Czym jest Wirtualne Środowisko Badawcze i czemu służy izolacja projektów?

Wirtualne Środowisko Badawcze to dedykowana przestrzeń obliczeniowa tworzona na potrzeby konkretnego projektu badawczego, uruchamiana na wniosek badacza po akceptacji administratora platformy. Każde środowisko jest izolowane na trzech poziomach:

kosztowym — zasoby i ich zużycie są rozliczane odrębnie dla każdego projektu,
dostępowym — dostęp do danych i narzędzi jest kontrolowany zgodnie z przypisanymi rolami,
obliczeniowym — badania w ramach jednego projektu nie wpływają na wydajność ani wyniki innych projektów.

Dzięki temu różne zespoły badawcze mogą prowadzić równolegle niezależne projekty w ramach jednej platformy, bez ryzyka konfliktów w obszarze danych, uprawnień lub budżetów.

Jaka jest różnica między HL7 FHIR a OMOP CDM i które z nich stosuje platforma?

Platforma obsługuje i udostępnia zarówno format HL7 FHIR, jak i OMOP CDM, wykorzystując je komplementarnie.

HL7 FHIR pełni dwie role. Po pierwsze, zapewnia interoperacyjność z zewnętrznymi systemami, w tym systemami szpitalnymi, rejestrami krajowymi oraz inicjatywami takimi jak Europejska Przestrzeń Danych o Zdrowiu (EHDS). Po drugie, platforma udostępnia interfejs FHIR Search API, który umożliwia realizację zapytań statystycznych (np. określenie liczby pacjentów spełniających zadane kryteria) bez dostępu do danych jednostkowych — będąc interfejsem statystycznym dla zewnętrznych podmiotów. Odpowiedzi mają zawsze charakter agregacyjny i numeryczny.

OMOP CDM jest wspólnym modelem analitycznym rozwijanym przez OHDSI, do którego platforma konwertuje dane kliniczne. Standaryzacja w tym modelu umożliwia porównywanie wyników między ośrodkami oraz wykorzystanie gotowych narzędzi analitycznych zbudowanych przez społeczność badawczą.

Połączenie obu standardów daje realną wartość w Wirtualnym Środowisku Badawczym. Zdefiniowane kohorty pacjentów mogą być prezentowane zarówno w standardzie FHIR, jak i OMOP. Tym samym spełnione są zarówno wymagania interoperacyjności, jak i zapewniona jest zgodność z najlepszymi praktykami analityki badań klinicznych.

Czy badacz bez umiejętności programowania może korzystać z platformy?

Tak. Platforma udostępnia narzędzia no-code i low-code umożliwiające eksplorację danych oraz budowę modeli ML za pomocą interfejsu graficznego. Jednocześnie zaawansowani użytkownicy mają dostęp do pełnego środowiska Python i R. Oba podejścia mogą być stosowane równolegle w ramach jednego projektu, co umożliwia efektywną współpracę zespołów o zróżnicowanych kompetencjach.

Jak platforma skaluje zasoby obliczeniowe pod duże projekty badawcze?

Każde Wirtualne Środowisko Badawcze dysponuje indywidualnie konfigurowaną pulą zasobów obejmującą CPU, pamięć operacyjną, przestrzeń dyskową oraz w razie potrzeby dostęp do GPU wykorzystywanych m.in. w analizie obrazów i trenowaniu modeli.

Zasoby są skalowane dynamicznie — zwiększane w okresach intensywnych obliczeń oraz redukowane w przestojach, co zapewnia efektywne wykorzystanie infrastruktury i optymalizację kosztów operacyjnych projektu.

Jakie modele AI i ML są dostępne na platformie?

Platforma zapewnia środowisko do budowy modeli predykcyjnych, klasyfikacyjnych i regresyjnych, a także dostęp do pretrenowanych dużych modeli językowych wspierających język polski i terminologię medyczną. Dostępne są również narzędzia klasy AutoML umożliwiające automatyczny dobór i optymalizację modeli. Wytrenowane modele mogą być publikowane w postaci usług REST API, dostępnych dla innych systemów organizacji lub podmiotów zewnętrznych.

Jak działają pseudonimizacja i anonimizacja danych na platformie?

Dane wrażliwe (w tym dane pacjentów oraz dane obrazowe) są przetwarzane wyłącznie w postaci pseudonimizowanej lub — w zależności od potrzeb — anonimizowanej. Badacze pracują bezpośrednio na danych w ramach Wirtualnego Środowiska Badawczego bez dostępu do informacji umożliwiających identyfikację pacjentów. Wyniki analiz oraz definiowane kohorty są przygotowywane w sposób uniemożliwiający reidentyfikację osób.

Czy platforma obsługuje dane genomiczne i obrazy DICOM?

Tak. Platforma zapewnia natywną obsługę danych obrazowych DICOM, w tym możliwość ich segmentacji, adnotacji i trenowania modeli bezpośrednio w izolowanym środowisku projektowym. Obsługiwane są również dane genomiczne w formatach FASTQ, BAM i CRAM. Praca na tych typach danych odbywa się w całości w ramach platformy, bez konieczności ich eksportu poza platformę.

Źródła danych

Health data & AI platform

Użytkownicy

Rozproszenie i brak standaryzacji danych

Ograniczona interoperacyjność między ośrodkami

Trudność w przygotowaniu danych do badań

Wysokie wymagania regulacyjne

Ryzyka formalne i brak audytowalności

Zmienność krajobrazu regulacyjnego

Ograniczony dostęp do skalowalnych zasobów obliczeniowych

Czasochłonne przygotowanie środowiska i danych

Trudność budowy kohort pacjentów

AWS HealthLake

AWS HealthImaging

AWS HealthOmics

Ekosystem AI/ML w chmurze AWS

Zarządzanie kosztami w modelu pay-as-you-go

Skalowalna infrastruktura

Ochrona danych osobowych

European Health Data Space

Rekomendacje Agencji Badań Medycznych

Interoperacyjność systemów

Dane obserwacyjne

Standardy bezpieczeństwa

Praca na pełnym obrazie danych medycznych

Zaawansowane analizy oraz budowa modeli AI bez barier technicznych i regulacyjnych

Wiarygodne, uporządkowane i gotowe do wielokrotnego wykorzystania dane

Wiele zespołów i projektów, jeden ekosystem

Dane wrażliwe pod ścisłą ochroną

Compliance wbudowany w platformę

Pilotaż i ocena gotowości

Wdrożenie i integracja

Skalowanie i utrzymanie

FAQ