Google wprowadza nowe funkcje AI i udogodnienia dostępnościowe na Androidzie oraz w przeglądarce Chrome
Google ogłosiło najnowszą aktualizację systemu Android oraz przeglądarki Chrome, koncentrującą się na rozbudowanych funkcjach sztucznej inteligencji i poprawie dostępności cyfrowej dla wszystkich użytkowników. Te innowacje szczególnie ucieszą osoby z niepełnosprawnościami wzrokowymi, ponieważ jedno z głównych usprawnień dotyczy rozbudowanej wersji czytnika ekranowego TalkBack, który teraz współpracuje z modelem Gemini – zaawansowaną sztuczną inteligencją Google.
Dzięki integracji z Gemini, TalkBack potrafi teraz nie tylko opisywać zawartość obrazów, ale również odpowiadać na pytania dotyczące tego, co znajduje się na zdjęciu lub aktualnie wyświetlane jest na ekranie. Oznacza to, że osoby niewidome lub słabowidzące zyskują możliwość głębszego zrozumienia komunikatów wizualnych – nawet jeśli obrazy nie posiadają przypisanego tekstu alternatywnego (Alt Text). Przykładowo, po otrzymaniu zdjęcia nowej gitary od znajomego, TalkBack nie tylko opisze instrument, lecz również odpowie na pytania dotyczące marki czy koloru.
Co więcej, funkcjonalność została rozszerzona również na cały ekran urządzenia. Użytkownik przeglądający aplikację zakupową może zapytać Gemini o szczegóły dotyczące produktów – z jakiego materiału są wykonane dane przedmioty, czy są objęte promocją, a także uzyskać inne istotne informacje, które normalnie wymagałyby wzrokowego zaangażowania.
To jednak nie koniec nowości. Google przedstawiło również ulepszoną funkcję Expressive Captions dla systemu Android. To inteligentne napisy w czasie rzeczywistym, które nie tylko zamieniają mowę na tekst, ale teraz także lepiej oddają ton i emocje wypowiedzi. Nowa opcja „duration” pozwala na rozpoznanie przeciąganych głosek i intonacji. Dzięki temu, gdy komentator sportowy wykrzykuje „niesaaaaamowity gol!”, w napisach również zarejestrowana zostanie długość i ekspresja wypowiedzi. System rozróżni również odcienie wypowiedzi, jak np. standardowe „nie” od emocjonalnego „nieeeee!” Nowe aktualizacje umożliwiają ponadto identyfikację dźwięków w tle, takich jak gwizdy czy odchrząknięcia, co jeszcze bardziej przybliża użytkownikowi kontekst sytuacyjny.
Wszystkie te ulepszenia wprowadzane są w języku angielskim dla użytkowników w Stanach Zjednoczonych, Wielkiej Brytanii, Kanadzie oraz Australii, którzy korzystają z urządzeń działających pod kontrolą Androida 15 lub nowszego.
Również użytkownicy przeglądarki Chrome nie pozostali bez dobrych wiadomości. Do tej pory osoby korzystające z czytników ekranowych miały znaczne problemy z odczytywaniem zeskanowanych plików PDF w wersji desktopowej przeglądarki. Teraz jednak Chrome automatycznie rozpoznaje takie dokumenty, umożliwiając zaznaczanie, kopiowanie oraz przeszukiwanie treści, jak w przypadku standardowych stron internetowych. Wszystko to możliwe jest dzięki zastosowaniu technologii OCR (optyczne rozpoznawanie znaków), która konwertuje grafikę tekstu na edytowalny tekst cyfrowy.
Na koniec warto wspomnieć o udoskonaleniach dotyczących obsługi tekstu na stronach internetowych za pomocą funkcji Page Zoom na Chrome na Androidzie. Użytkownicy mogą teraz powiększać rozmiar tekstu bez wpływu na układ całej witryny – co często bywało problematyczne przy zwykłym zoomowaniu. Co więcej, preferencje dotyczące powiększenia można teraz ustawić globalnie dla wszystkich odwiedzanych stron lub spersonalizować dla konkretnych serwisów. Funkcja ta jest dostępna poprzez ikonę trzech kropek w prawym górnym rogu przeglądarki.
Wprowadzone przez Google innowacje są istotnym krokiem w stronę inkluzywnej technologii, która pozwala każdemu – niezależnie od ograniczeń fizycznych – czerpać pełne korzyści z cyfrowego świata.