Visual Intelligence to najnowsza i zaawansowana funkcja dostępna wyłącznie dla modeli iPhone’a 16 oraz iPhone’a 16 Pro. Dzięki niej użytkownicy mogą korzystać z szeregu zaawansowanych możliwości opartych na integracji technologii AI oraz kamery. Visual Intelligence działa od systemu iOS 18.2, wykorzystując dedykowany przycisk „Camera Control”, który otwiera dostęp do funkcji na zupełnie nowym poziomie, oferując m.in. rozpoznawanie tekstu, wyszukiwanie wizualne oraz współpracę z ChatGPT.
Jak aktywować i używać Visual Intelligence?
Funkcja Visual Intelligence uruchamiana jest poprzez długie przytrzymanie przycisku „Camera Control”. Krótkie naciśnięcie otwiera zwykły aparat fotograficzny, dlatego, aby aktywować Visual Intelligence, konieczne jest wykonanie odmiennych gestów. Warto jednak upewnić się, że kamera nie jest już uruchomiona w tle, gdyż w takim przypadku funkcja ta nie zadziała.
Interfejs Visual Intelligence jest prosty i intuicyjny. Po aktywacji użytkownik widzi obraz z kamery, przycisk do wykonania zdjęcia oraz opcje „Ask” (z pytaniem do ChatGPT) i „Search” (wyszukiwanie obrazu w Google). Funkcja działa jedynie na podstawie aktualnie zrobionego zdjęcia – niestety, nie można analizować wcześniej zapisanych fotografii ani używać podglądu z kamery w czasie rzeczywistym.
Szczegóły na temat miejsc w Twoim otoczeniu
Jednym z kluczowych zastosowań jest możliwość uzyskania informacji na temat miejsc w otoczeniu, takich jak restauracje czy sklepy. Wystarczy wykonać zdjęcie lokalu, by pozyskać dane o jego godzinach otwarcia, menu, dostępnych usługach, zarezerwować stolik, złożyć zamówienie na wynos czy przejść do strony internetowej miejsca. Wszystko to bezpośrednio z poziomu interfejsu Visual Intelligence.
Podsumowywanie tekstu
Funkcja podsumowywania tekstu ułatwia życie w sytuacjach, gdy mamy do czynienia z dużymi blokami informacji. Użytkownik może zrobić zdjęcie wybranego fragmentu tekstu i wybrać opcję „Summarize”, aby otrzymać zwięzłe streszczenie treści. Idealnie sprawdza się przy dłuższych dokumentach, jednak należy pamiętać, że podsumowanie generowane przez system ma charakter skrótowy i nie zagłębia się zbytnio w szczegóły.
Odczytywanie tekstu na głos
Dzięki funkcji „Read Aloud” użytkownik ma możliwość usłyszenia wybranego tekstu odczytywanego przez Siri. Po wykonaniu zdjęcia tekstu wystarczy wybrać opcję na ekranie, by Siri odczytała dany fragment w wybranym przez użytkownika głosie. Jest to szczególnie przydatne podczas prowadzenia samochodu, gotowania lub w sytuacjach, gdy ręce są zajęte.
Tłumaczenie tekstu
Dla miłośników podróży funkcja tłumaczenia tekstu będzie nieocenionym narzędziem. Co prawda, jak na razie wspiera ona jedynie język angielski, ale nadal umożliwia szybkie przetłumaczenie uchwyconych materiałów wizualnych w obcym języku na język użytkownika. To idealne rozwiązanie podczas zagranicznych wakacji.
Obsługa linków i kontaktów
Visual Intelligence rozpoznaje także linki internetowe, adresy e-mail, numery telefonów czy adresy fizyczne uchwycone na zdjęciach. Kliknięcie w aktywny link umożliwia szybkie odwiedzenie strony, natomiast adresy e-mail i numery telefonów można bez trudu wykorzystać do wysłania wiadomości lub wykonania połączenia. Co więcej, adresy można zaimportować do kontaktów lub od razu otworzyć w aplikacji Mapy.
Tworzenie wydarzeń w kalendarzu
Gdy Visual Intelligence rozpozna datę na zdjęciu, automatycznie zaproponuje dodanie przypomnienia lub wydarzenia do kalendarza. To niezwykle przydatna funkcja dla osób zapracowanych, które często spotykają się z plakatami reklamującymi różne wydarzenia czy ulotkami z zaplanowanymi spotkaniami.
Skanowanie kodów QR
Funkcjonalność Visual Intelligence obejmuje też skanowanie kodów QR. W tym przypadku jednak nie ma potrzeby wykonywania zdjęcia – wystarczy skierować kamerę na kod QR i kliknąć wyświetlony link. Proste, szybkie i znacznie usprawniające codzienne użytkowanie.
Integracja z ChatGPT – pytaj i otrzymuj informacje
Dzięki specjalnej integracji Visual Intelligence pozwala na wysyłanie zapytań do ChatGPT. Wystarczy zrobić zdjęcie danego przedmiotu, a następnie skorzystać z opcji „Ask”. System automatycznie przekieruje nas do okna czatu, gdzie można zadać pytanie, np. „Co to jest?” lub „Do czego to służy?”. Dodatkową korzyścią jest możliwość prowadzenia rozwiniętej konwersacji na temat przekierowanego obrazu.
Wyszukiwanie obrazów w Google
Wyjątkowo przydatną funkcją jest wyszukiwanie obrazów w Google. Po wykonaniu zdjęcia i wybraniu opcji „Search” użytkownik zostaje przekierowany do wyników wyszukiwania Google. Funkcja okazuje się szczególnie cenna, kiedy chcemy znaleźć przedmiot widoczny na zdjęciu – np. konkretnego modelu butów, mebla czy gadżetu.
Podsumowanie
Visual Intelligence to rewolucyjna funkcja, która łączy sztuczną inteligencję z możliwościami aparatu smartfona. Nowoczesne narzędzia, takie jak podsumowywanie tekstów, rozpoznawanie miejsc, tłumaczenia, współpraca z ChatGPT czy integracja z Google, sprawiają, że codzienne życie staje się bardziej wygodne. Choć funkcja dostępna jest na wyłączność dla użytkowników iPhone’a 16 i iPhone’a 16 Pro, bez wątpienia stawia nowe standardy w zakresie zaawansowanych technologii mobilnych. To narzędzie, które może odmienić sposób, w jaki korzystamy z naszych urządzeń na co dzień.