top of page

AI content licensing program - czy nadchodzi koniec darmowego dostępu do jakości w internecie?

  • Zdjęcie autora: Cezary Ochman
    Cezary Ochman
  • 26 sty
  • 2 minut(y) czytania

Reddit podpisał wielomilionowe umowy na udostępnienie swoich dyskusji do trenowania modeli. Koncerny takie jak News Corp (właściciel m.in. The Wall Street Journal, The Sun), Axel Springer (właściciel m.in. Politico, Business Insider, Onet, Newsweek, Forbes oraz wiele innych) czy The Guardian weszły w partnerstwa z OpenAI, dzięki czemu ChatGPT może cytować ich artykuły w czasie rzeczywistym. Shutterstock i Adobe i stworzyły programy, w których fotografowie otrzymują wynagrodzenie (tzw. Contributor Fund), jeśli ich zdjęcia zostaną wykorzystane do trenowania generatorów obrazów (np. Adobe Firefly). O co w tym chodzi i co się dzieje?

AI content licensing program

Trend ten wynika z kilku czynników, które zdominowały rynek AI w ostatnich latach. Pierwszym z nich jest wyczerpanie publicznych danych. Firmy takie jak OpenAI, Google etc. "przekopały" już większość ogólnodostępnego internetu. Aby ich modele stały się mądrzejsze potrzebują wysokiej jakości danych, które często znajdują się za płatnymi subskrypcjami. Kolejnym elementem są kwestie prawne i regulacyjne oraz widoczny trend w masowych pozwach o naruszenie praw autorskich (np. proces The New York Times vs. OpenAI). To zmusza gigantów technologicznych do uregulowania statusu danych treningowych. Kolejnym elementem jest jakość i unikalność danych. Modele AI trenowane na własnych, generowanych przez siebie treściach (tzw. synthetic data), zaczynają "głupieć". Aby utrzymać wysoką jakość odpowiedzi AI musi mieć więc stały dostęp do świeżych, rzetelnych i tworzonych przez ludzi informacji. Uff... ludzie nadal są jeszcze potrzebni 😊


Te wszystkie elementy spowodowały trend i tzw. AI content licensing program, czyli licencjonowaniu treści. Jest to w dużym skrócie mówiąc tzn. pisząc... odkupowanie treści przez (AI) big techy i wykorzystywanie ich do trenowania swoich modeli. Co powoduje ten trend? Możliwe zanikanie wysokiej treści materiałów z publicznego widoku i karmienie nimi algorytmów AI. Kolejnym elementem mogą być nowe modele biznesowe - czyli np. autorzy treści będą podpisywać programy licencyjne i karmić danymi AI, a "zwykły Kowalski" będzie zmuszony do kupowania licencji od big techów, aby otrzymać cokolwiek wartościowego... chociaż tu mam wątpliwości, bo większość ludzi karmi się małej jakości treścią... 😢 Z drugiej strony może to szansa dla niektórych z nas? Szansa na sprzedawanie cennej wiedzy i lat doświadczeń??? 🧐


Co myślicie o tym trendzie? Co może jeszcze spowodować? Podzielcie się przemyśleniami w komentarzu.

 

Linki:

Komentarze


bottom of page