Apple Planet
  • REDAKCJA
  • WSPÓŁPRACA
  • POLITYKA PRYWATNOŚCI
No Result
View All Result
  • Apple
  • Sztuczna inteligencja AI
  • Smartfony
  • Nauka i technika
  • Komputery & Tablety
  • Security
  • Nowinki
    • Recenzje
    • Poradniki
    • iDared Serwis
      • Serwis iPhone
      • Serwis MacBook
      • Serwis Telefonów Samsung
      • Serwis Telefonów Xiaomi
piątek, 9 maja, 2025
  • Apple
  • Sztuczna inteligencja AI
  • Smartfony
  • Nauka i technika
  • Komputery & Tablety
  • Security
  • Nowinki
    • Recenzje
    • Poradniki
    • iDared Serwis
      • Serwis iPhone
      • Serwis MacBook
      • Serwis Telefonów Samsung
      • Serwis Telefonów Xiaomi
No Result
View All Result
Apple Planet
No Result
View All Result
Home Sztuczna inteligencja AI

Dokładność rozpoznawania obrazów: Niewidoczne wyzwanie, które dezorientuje dzisiejsze AI

od Pan z ApplePlanet
8 stycznia, 2024
w Sztuczna inteligencja AI
0
Dokładność rozpoznawania obrazów: Niewidoczne wyzwanie, które dezorientuje dzisiejsze AI

3d rendering humanoid robot with ai text in ciucuit pattern

468
SHARES
1.5k
VIEWS
Udostępnij na FacebookuUdostępnij na Tweeterze

„Minimalny czas widzenia” to wskaźnik oceniający złożoność rozpoznawania obrazów dla systemów AI poprzez mierzenie czasu potrzebnego na dokładną identyfikację przez człowieka. Wyobraź sobie, że przeglądasz zdjęcia na swoim telefonie i natrafiasz na obraz, który na początku nie możesz rozpoznać. Wygląda to może na coś puszystego na kanapie; czy to poduszka czy płaszcz? Po kilku sekundach dochodzi do Ciebie — oczywiście! Ta kula sierści to kot Twojego przyjaciela, Mocha. Dlaczego niektóre Twoje zdjęcia można zrozumieć od razu, a to zdjęcie kota było znacznie trudniejsze?

 

Badacze z MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) byli zaskoczeni, że pomimo krytycznego znaczenia zrozumienia danych wizualnych w kluczowych obszarach, od opieki zdrowotnej po transport po urządzenia domowe, koncepcja trudności rozpoznania obrazu przez ludzi została prawie całkowicie zignorowana. Jeden z głównych czynników postępu w AI opartym na uczeniu głębokim to zestawy danych, jednak niewiele wiemy o tym, jak dane napędzają postęp w uczeniu głębokim na dużą skalę poza tym, że większe jest lepsze.

W rzeczywistych zastosowaniach wymagających zrozumienia danych wizualnych ludzie przewyższają modele rozpoznawania obiektów, pomimo faktu, że modele dobrze radzą sobie z obecnymi zestawami danych, w tym tymi specjalnie zaprojektowanymi do wyzwania maszyn z obrazami wolnymi od uprzedzeń lub przesunięciami w dystrybucji. Ten problem utrzymuje się częściowo dlatego, że nie mamy wytycznych dotyczących absolutnej trudności obrazu lub zestawu danych. Bez kontroli nad trudnością obrazów używanych do oceny trudno obiektywnie ocenić postęp w kierunku osiągnięcia wydajności na poziomie ludzkim, pokryć zakres ludzkich zdolności i zwiększyć wyzwanie stawiane przez zestaw danych.

 

Aby wypełnić tę lukę wiedzy, David Mayo, doktorant z MIT w dziedzinie inżynierii elektrycznej i nauki o komputerach oraz członek CSAIL, zagłębił się w głęboki świat zestawów danych obrazów, badając, dlaczego niektóre obrazy są trudniejsze do rozpoznania dla ludzi i maszyn niż inne. „Niektóre obrazy wymagają dłuższego czasu do rozpoznania, a zrozumienie aktywności mózgu podczas tego procesu i jej związku z modelami uczenia maszynowego jest niezbędne. Być może w naszych obecnych modelach brakuje złożonych obwodów neuronowych lub unikalnych mechanizmów, widocznych tylko podczas testowania z trudnymi bodźcami wizualnymi. To badanie jest kluczowe dla zrozumienia i ulepszania modeli widzenia maszynowego,” mówi Mayo, główny autor nowej pracy na ten temat.

Prowadzi to do opracowania nowego wskaźnika, „minimalnego czasu widzenia” (MVT), który określa trudność rozpoznania obrazu na podstawie czasu, jakiego osoba potrzebuje do jego zobaczenia przed dokonaniem poprawnej identyfikacji. Wykorzystując podzestaw ImageNet, popularnego zestawu danych w uczeniu maszynowym, oraz ObjectNet, zestawu danych zaprojektowanego do testowania odporności rozpoznawania obiektów, zespół pokazywał uczestnikom obrazy przez różne okresy od 17 milisekund do 10 sekund, prosząc ich o wybranie poprawnego obiektu spośród 50 opcji. Po ponad 200 000 próbach prezentacji obrazów zespół stwierdził, że istniejące zestawy testów, w tym ObjectNet, wydają się być skierowane w stronę łatwiejszych, krótszych obrazów MVT, przy czym większość wyników benchmarkowych pochodzi z obrazów łatwych dla ludzi.

Projekt zidentyfikował interesujące trendy w wydajności modeli — szczególnie w odniesieniu do skalowania. Większe modele wykazały znaczną poprawę na prostszych obrazach, ale osiągnęły mniejszy postęp na bardziej wymagających obrazach. Modele CLIP, które łączą język i wizję, wyróżniały się, ponieważ poruszały się w kierunku bardziej ludzkiego rozpoznawania.

Share187Tweet117
Poprzedni artykuł

Głębokie sieci neuronowe obiecujące jako modele słuchu ludzkiego

Następny artykuł

Model obliczeniowy uchwycił nieuchwytne stany przejściowe reakcji chemicznych

Następny artykuł
Model obliczeniowy uchwycił nieuchwytne stany przejściowe reakcji chemicznych

Model obliczeniowy uchwycił nieuchwytne stany przejściowe reakcji chemicznych

Zapraszamy

Polub nas i bądź na bieżąco

Ostatnie Wpisy

  • Realme GT 7 – pierwsze wrażenia i testy 9 maja, 2025
  • Składany ekran iPhone’a od Samsunga z funkcją, której brakuje w Galaxy Z Fold6 9 maja, 2025
  • Samsung Galaxy S25 Edge – ekran wzmocniony szkłem Gorilla Glass Ceramic 2 9 maja, 2025
  • Nowa funkcja Now Bar wkrótce trafi na smartwatche Galaxy 9 maja, 2025
  • Jak Apple Vision Pro pomaga tworzyć i zachowywać rodzinne wspomnienia na Dzień Matki 8 maja, 2025

Informacje

  • Polityka prywatności
  • Redakcja
  • Współpraca
  • REDAKCJA
  • WSPÓŁPRACA
  • POLITYKA PRYWATNOŚCI

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Apple
  • Sztuczna inteligencja AI
  • Smartfony
  • Nauka i technika
  • Komputery & Tablety
  • Security
  • Nowinki
    • Recenzje
    • Poradniki
    • iDared Serwis
      • Serwis iPhone
      • Serwis MacBook
      • Serwis Telefonów Samsung
      • Serwis Telefonów Xiaomi