Po utracie krtani można odzyskać nie tylko głos

Po raz pierwszy na świecie podczas koncertu zabrzmi śpiew osoby po laryngektomii wykorzystującej bioniczną krtań. – Chcemy pokazać, że technologia może przywracać nie tylko możliwość mówienia, ale także pełnię wyrażania siebie – mówi Konrad Zieliński, twórca protezy.

„Menedżer Zdrowia” publikuje rozmowę z Konradem Zielińskim
Zieliński to naukowiec, doktorant Uniwersytetu Warszawskiego oraz współzałożyciel i CEO start-upu Uhura Bionics
Ekspert po chorobie nowotworowej i utracie krtani zajął się tworzeniem technologii, która przywraca chorym naturalnie brzmiący głos
Rozwija rewolucyjny projekt „Okulary dla głosu” i sztuczną krtań nowej generacji, walcząc z wykluczeniem pacjentów po laryngektomii

26 czerwca 2026 r. w Parku Bródnowskim odbędzie się koncert, podczas którego zaśpiewa pan trzy utwory. Nie byłoby w tym nic niezwykłego, gdyby nie fakt, że wystąpi pan z wykorzystaniem bionicznej krtani. Dotychczas to rozwiązanie umożliwiało jedynie mówienie. Teraz osoby po laryngektomii będą mogły również śpiewać. To będzie pierwszy taki występ na świecie. Co ma udowodnić to wydarzenie?

Są już pacjenci po tym zabiegu, którzy śpiewają, między innymi w chórach. Zazwyczaj są to jednak projekty, w których występują wspólnie wykonawcy z zachowaną krtanią oraz chorzy po jej usunięciu. Często też mają oni wszczepione inwazyjne protezy głosowe, a nie krtanie elektroniczne, które dotychczas kojarzyły się z robotycznym głosem. My chcemy pokazać, że technologia może przywracać pełniejsze możliwości ekspresji. Użytkownicy naszych aparatów mówią, że rozwiązaliśmy już problem mówienia, krzyczenia czy wyrażania emocji. Pozostaje jednak pytanie, co z sytuacjami, w których ktoś chciałby pokusić się o wokal przy ognisku albo wystąpić na scenie. To dla mnie szczególnie ważne, ponieważ przed chorobą sam grałem w zespole muzycznym. Właśnie na takie wyzwania chcemy dziś odpowiadać.

Co znajdzie się w repertuarze?

Wydarzenie organizuje studio muzyczne i będzie ono miało charakter musicalowy. W repertuarze znajdą się między innymi utwory z filmów Disneya. Jedną piosenkę wykonam solo, drugą zaśpiewam w duecie (to nasz utwór autorski), a trzecią wspólnie z zaproszonymi wokalistami.

Jak wygląda nauka śpiewu z wykorzystaniem bionicznej krtani? Z jakimi ograniczeniami anatomicznymi i technologicznymi musieliście się zmierzyć?

Ta praca przebiega równolegle na dwóch płaszczyznach. Z jednej strony uczę się wykorzystywać aparat w warunkach muzycznych i rozwijać własną ekspresję. Z drugiej strony zespół inżynierów stale udoskonala technologię, aby jak najlepiej sprawdzała się podczas występów. Rozwiązując tak złożony problem, jednocześnie poprawiamy działanie sprzętu w codziennym użytkowaniu. W naszym zespole pracują specjaliści od wokalistyki, programowania niskopoziomowego oraz konstrukcji urządzeń. Biuro, warsztat i studio muzyczne znajdują się w jednym miejscu, dlatego możemy bardzo szybko testować kolejne pomysły.

Co podczas śpiewania stanowi największe wyzwanie?

Najważniejszą nowością jest możliwość rzeczywistego prowadzenia melodii. Dotychczasowe metody dawały bardzo mechaniczny, monotonny dźwięk. Nasze rozwiązania zapewniają już płynniejszą intonację, ale dopiero teraz osiągamy możliwość trafiania w konkretne czyste tony, co jest przecież podstawą śpiewu. Drugim elementem jest ekspresja. Zależy nam na tym, aby użytkownik mógł przekazywać emocje i różne intencje, niezależnie od tego, czy wykonuje utwór romantyczny, czy dynamiczny.

Jak rozumiem, ten projekt wynika również z pana osobistych doświadczeń?

Tak. Przed chorobą byłem muzykiem i miałem doświadczenia aktorskie, dlatego możliwość wyrażania emocji zawsze była dla mnie kluczowa. Wśród naszych użytkowników są także osoby, które zawodowo pracowały głosem – między innymi neuropsychologowie czy mówcy publiczni. Dla nich odzyskanie pełnej ekspresji ma ogromne znaczenie.

Czy ten wariant urządzenia, który umożliwia śpiew, został już przetestowany przez pacjentów?

Obecnie w sprzedaży są modele pozwalające mówić i krzyczeć. Funkcji śpiewania nie udostępnialiśmy jeszcze klientom. Po raz pierwszy zaprosiliśmy ich, wraz z rodzinami, logopedami i lekarzami, właśnie na dzisiejszy koncert. Testy z udziałem pacjentów planujemy rozpocząć jesienią.

Jaką rolę w tym projekcie odgrywa sztuczna inteligencja? Czy dzięki niej możliwe będzie odtworzenie głosu pacjenta sprzed operacji?

W przypadku syntezy tekstu na mowę (text-to-speech) jest to już możliwe. Problem pojawia się wtedy, gdy chcemy przekształcać mowę lub śpiew w czasie rzeczywistym. Testowaliśmy różne rozwiązania, ale napotkaliśmy dwa zasadnicze ograniczenia. Pierwszym jest opóźnienie. Wygenerowany głos pojawiał się dopiero po około dwóch sekundach, co uniemożliwia swobodną rozmowę czy śpiew. Drugim problemem jest ekspresja. Obecne modele sztucznej inteligencji wciąż zbyt mocno wygładzają emocje zawarte w głosie. Myślę jednak, że w ciągu dwóch lub trzech lat uda się to barierę przełamać.

Rozpoczynacie współpracę grantową z ElevenLabs, firmą założoną przez dwóch Polaków, która dziś jest światowym liderem w dziedzinie sztucznej inteligencji do syntezy i klonowania głosu. Będziecie korzystać z ich technologii?

Na razie nie mówimy jeszcze o pełnej integracji. Otrzymamy wcześniejszy dostęp do najnowszego modelu, aby testować jego możliwości i sprawdzać, jak można go zaadaptować do naszych potrzeb. Nadal nie będzie to jednak oznaczało, że użytkownik będzie mógł śpiewać swoim dawnym głosem w czasie rzeczywistym z pomocą AI. Taka technologia wciąż wymaga dopracowania. Sądzę natomiast, że w ciągu kilku miesięcy możliwe będzie generowanie śpiewu na podstawie wpisanego tekstu. Nawet takie rozwiązanie może być bardzo pomocne dla osób po operacji, ponieważ pozwoli im w większym stopniu wyrażać emocje i komunikować się z otoczeniem.

Do waszego zespołu dołączyła prof. Rupal Patel z Bostonu, jedna z pionierek personalizowanych głosów syntetycznych. Co wnosi do projektu?

Miałem okazję współpracować z profesor Patel podczas końcowej części mojego stażu doktorskiego. Dysponuje ona ogromnym doświadczeniem zarówno naukowym, jak i biznesowym. Budowała własną firmę, stworzyła jeden z największych zbiorów danych głosowych dla osób z zaburzeniami mowy i zajmowała się tym jeszcze przed obecnym boomem na sztuczną inteligencję. Doradza nam przy rozwijaniu technologii, budowaniu spółki, kontaktach z inwestorami oraz tworzeniu międzynarodowej sieci współpracy.

Produkujecie obecnie partię 500 sztuk urządzeń z myślą o rynkach światowych. Dlaczego zdecydowaliście się rozpocząć ekspansję od Stanów Zjednoczonych?

Powody są zarówno biznesowe, jak i regulacyjne. W Stanach Zjednoczonych można najpierw sprzedawać produkt jako elektronikę użytkową, a następnie przekształcić go w wyrób medyczny i ubiegać się o refundację. W Europie procedury są znacznie bardziej sztywne. Naszym celem jest wprowadzenie protezy w Polsce od razu jako wyrobu medycznego, aby mogła zostać objęta refundacją. Chcemy, żeby dla polskich pacjentów te pierwsze egzemplarze były praktycznie bezpłatne.

Ta „amerykańska ścieżka” może przyspieszyć wasze wejście na rynek europejski?

Tak, to rozwiązanie często rekomendowane medycznym start-upom. Nie oznacza to jednak rezygnacji ze Starego Kontynentu. Działamy z Polski, mamy tutaj siedzibę i chcemy jak najszybciej dystrybuować nasze urządzenia również na rynku krajowym. Jednocześnie rozwijamy działalność z myślą o wejściu między innymi do Niemiec.

Jesienią będziecie pozyskiwać kolejną rundę finansowania w Dolinie Krzemowej. Jakie są wasze cele?

Chcemy pozyskać dwa–trzy miliony dolarów. Środki pozwolą zwiększyć skalę produkcji oraz rozwijać wersję premium, przeznaczoną specjalnie do śpiewania. Naszym celem jest jej certyfikacja i uzyskanie częściowej refundacji zarówno w Stanach Zjednoczonych, jak i w Europie. Co ciekawe, amerykańscy inwestorzy często są bardziej skłonni finansować projekty o dużym potencjale jeszcze przed osiągnięciem przez nie pełnej dojrzałości rynkowej niż inwestorzy europejscy.

Niedawno otrzymaliście dwa miliony złotych z PARP na rozwój produktu. Dlaczego te środki zostaną przeznaczone między innymi na pozornie drobne elementy, takie jak złącze USB-C czy większa wytrzymałość obudowy?

Ponieważ wynikają one bezpośrednio z doświadczeń użytkowników. Pierwsza wersja produktu pozwala wejść na rynek i zebrać informacje zwrotne. Dopiero później można dopracowywać szczegóły, które mają ogromne znaczenie w codziennym użytkowaniu. To właśnie dzięki takim uwagom możemy tworzyć sprzęt bardziej trwały, wygodniejszy i lepiej odpowiadający potrzebom chorych.

Ostatnie miesiące przyniosły wam wiele nagród. Czy przekładają się one na wiarygodność za granicą?

W Polsce z pewnością pomagają budować rozpoznawalność. Na rynkach zagranicznych większe znaczenie mają jednak wyróżnienia zdobyte bezpośrednio w Stanach Zjednoczonych lub Europie Zachodniej. To one najmocniej wpływają na postrzeganie firmy przez inwestorów i partnerów.

Do końca roku planuje pan obronę doktoratu. Czego dotyczy rozprawa?

Rozprawa poświęcona jest bionicznej komunikacji osób po laryngektomii. Interesuje mnie przede wszystkim to, jak takie rozwiązania sprawdzają się w codziennym życiu. Analizuję nie tylko sam proces mówienia, lecz także konkretne sytuacje, takie jak jednoczesne jedzenie i rozmowa. Chcemy rozwijać technologię, uwzględniając rzeczywiste potrzeby użytkowników, a nie wyłącznie wyniki badań laboratoryjnych.

Działy: Aktualności w Warto wiedzieć Wywiady Aktualności

Tagi: Konrad Zieliński Rupal Patel bioniczna krtań laryngektomia proteza krtani utrata głosu medycyna technologia medyczna laryngologia sztuczna inteligencja artificial intelligence synteza głosu klonowanie głosu ElevenLabs start-up medyczny wyroby medyczne koncert muzyka śpiew Park Bródnowski PARP Polska Agencja Rozwoju Przedsiębiorczości Dolina Krzemowa

Twoja medyczna biblioteka w jednym miejscu

Podcasty, kursy, artykuły naukowe, nowości

Po utracie krtani można odzyskać nie tylko głos

Polecamy