Die Nachrichtenagentur Reuters berichtet, dass Reddit mit einem Unternehmen einen Lizenz-Vertrag in Höhe von jährlich 60 Millionen Dollar abgeschlossen hat, um diesem beim KI-Training zu helfen – mit den Beiträgen der Nutzer.

Mit über 50 Millionen täglich aktiven Nutzern und mehr als 100.000 aktiven Communities bietet Reddit eine Fundgrube für das Training von KI-Systemen.

Für Reddit bietet dies eine potenzielle neue Einnahmequelle neben der Werbung.

  • cron@feddit.de
    link
    fedilink
    Deutsch
    arrow-up
    21
    ·
    edit-2
    9 months ago

    Ich frag mich, ob Reddit ein guter Trainingsort für eine KI ist. Stell dir vor, du würdest eine neue Sprache lernen - und das nur indem du Reddit Kommentare liest. Klingt für mich nach keiner guten Datenbasis.

    • elvith@feddit.de
      link
      fedilink
      Deutsch
      arrow-up
      37
      ·
      edit-2
      9 months ago

      Hey ChatGPT write a short letter to my german aunt in which I tell her …

      ChatGPT: SPRICH DEUTSCH DU HURENSOHN

    • ___qwertz___@feddit.de
      link
      fedilink
      Deutsch
      arrow-up
      1
      ·
      9 months ago

      Ich meine mich daran zu erinnern dass frühere GPT Iterationen Reddit nutzten um Artikel vorzufiltern. Alle verlinkten Artikel mit einer bestimmten Anzahl Likes (ich glaube 3?) wurden gescraped und ins Modell verramscht. Ich weiß gar nicht, ob Kommentare überhaupt genutzt wurden.

      • cron@feddit.de
        link
        fedilink
        Deutsch
        arrow-up
        2
        ·
        9 months ago

        Dann ist also Reddit nur als Linksammung relevant, um die externen Inhalte zu scrapen? Das würde ja wieder nichts am Urheberrecht ändern.