Rozwój sztucznej inteligencji niesie ze sobą ogromne możliwości, ale również poważne wyzwania etyczne i prawne. Najnowsze doniesienia wskazują na potencjalne nieprawidłowości związane z wykorzystaniem zdjęć dzieci do treningu dużych modeli językowych, takich jak Stable Diffusion.

Organizacja Human Rights Watch (HRW) zwróciła uwagę na przypadki nielegalnego wykorzystania zdjęć brazylijskich dzieci do trenowania sztucznej inteligencji odpowiedzialnej za generowanie obrazów. Badaczka Hye Jung Han przeanalizowała próbkę danych z bazy LAION-5B, wykorzystywanej między innymi do treningu modelu Stable Diffusion, i odkryła 170 zdjęć brazylijskich dzieci, z których wiele pochodziło z prywatnych blogów i filmów na YouTube. Fotografie te obejmowały różne etapy dzieciństwa i prywatne sytuacje, co budzi poważne zastrzeżenia etyczne.

kontrowersje AI

Baza danych LAION-5B zawiera informacje z około 6 miliardów wpisów internetowych opublikowanych od 2008 roku. Chociaż organizacja LAION usunęła już zdjęcia z bazy, problem może być znacznie szerszy, gdyż badania HRW dotyczyły jedynie niewielkiego ułamka danych. Możliwe jest, że w bazie znajdują się również fotografie dzieci z innych krajów, co stanowi poważne naruszenie prywatności i praw osób przedstawionych na zdjęciach.

Baza LAION-5B jest niedostępna publicznie od grudnia zeszłego roku, kiedy to pojawiły się pierwsze raporty o obecności w niej nielegalnych treści. Od tego czasu Fundacja LAION współpracuje z organizacjami pozarządowymi, aby usunąć tego typu wpisy. Niemniej jednak, modele AI trenowane na tych danych mogą już wykorzystywać nielegalnie pozyskane materiały, co stanowi poważny problem etyczny i prawny.

Sprawa podkreśla potrzebę większej transparentności i odpowiedzialności w procesie trenowania modeli sztucznej inteligencji, aby zapewnić poszanowanie praw i prywatności wszystkich osób, których dane są wykorzystywane.

Przypadek ten pokazuje, jak ważne jest przestrzeganie standardów etycznych i prawnych w rozwoju technologii AI, aby uniknąć wykorzystywania wrażliwych danych bez zgody i chronić prywatność użytkowników.