Propriedade Intelectual no treinamento de modelos de IA: entre a lei e a inovação tecnológica

A presença de obras autorais na base de dados dos sistemas é incontestável./Canva
A presença de obras autorais na base de dados dos sistemas é incontestável./Canva
A conciliação entre evolução tecnológica e criações humanas parece se encontrar num equilíbrio frágil.
Fecha de publicación: 09/11/2023

A disponibilização de sistemas de inteligência artificial generativa abertos ao público pode ter representado a maior revolução tecnológica desde a criação da internet, em 1983. Lançado no final de 2022, o ChatGPT, chatbot da OpenAI e principal plataforma generativa de IA da atualidade, quebrou recordes ao atingir a base de 100 milhões de usuários ativos após apenas dois meses de operação. A potencial transformação social impulsionada por tais mecanismos ainda é de difícil dimensionamento. No entanto, fato é que tal cenário produz desafios jurídicos regulatórios cruciais, especialmente com relação à proteção de direitos de propriedade intelectual.

 

Nessa linha, diferentes instituições como o United States Copyright Office e o United Kingdom Intellectual Property Office, provocados por requerimentos ou comitês governamentais, ao analisar o tema, chamaram atenção para uma questão em especial: o uso de obras protegidas por direitos autorais para treinar modelos de inteligência artificial. Segundo estudo “LLaMA: Open and Efficient Foundation Language Models produzido e divulgado pela Meta em fevereiro de 2023, o sistema desenvolvido pela empresa mãe do Facebook e Instagram usa uma variedade de fontes como base de dados para treinamento do modelo, utilizando informações publicamente disponíveis compatíveis com open sourcing, sem qualquer ressalva quanto à forma com que tais dados foram tornados públicos.

 

Tais práticas indiscriminadas de web scraping, comuns a diversos players da internet, vêm se tornando o alvo inicial de litígios sobre violações de direitos de propriedade intelectual por ferramentas de inteligência artificial, principalmente nos EUA. O mais recente deles envolve justamente as duas empresas aqui referenciadas. A comediante Sarah Silverman e os escritores Christopher Golden e Richard Kadrey iniciaram uma class action perante a Corte Distrital do Distrito Norte da California alegando violações de direitos autorais perpetradas pela OpenAI e pela Meta, as quais teriam usado material protegido disponibilizado ilegalmente na internet para treinar seus sistemas sem qualquer anuência ou compensação financeira aos autores.


Leia também: Cenário regulatório global da Inteligência Artificial


A presença de obras autorais na base de dados dos sistemas é incontestável. Resumos de livros preparados inteiramente pelo ChatGPT movidos por um prompt simples foram juntados como evidência ao processo e comprovam a conduta das rés. No entanto, a extensão do embate vai além e chega na necessária delimitação judicial do que seria um uso justificado e, portanto, lícito das obras protegidas por direitos autorais e o que poderia caracterizar infringências decorrentes do treinamento de sistemas de IA.

 

O resultado da ação pode ser um ponto crucial nessa revolução tecnológica. A caracterização de tais práticas como infringentes tem o potencial de desviar o curso dos sistemas generativos e impactar o modelo de negócios de empresas que investem pesado na tendência. Isso porque, ainda que o sistema norte-americano seja baseado na lógica do copyright e ainda que outros destacados centros em uso de internet e IA (como o Brasil) adotem modelos derivados dos droit d’auteur, é indescritível a força de uma decisão exarada pela jurisdição nacional das maiores corporações desse mercado.

 

Para adicionar mais dramaticidade, o caso parece pairar em considerável indefinição. De um lado, os requerentes sustentam que o uso de obras protegidas por direitos de propriedade intelectual pelas plataformas de IA sem anuência ou compensação financeira aos autores viola seus direitos patrimoniais. Sustentam também que todo resultado gerado pelas ferramentas utilizando dados de suas obras configuraria trabalhos transformativos não autorizados e, portanto, infringentes.

 

No corner oposto, as plataformas argumentam, em pedidos de arquivamentos sumários, que o propósito do sistema normativo de propriedade intelectual é a promoção do progresso da ciência e das artes úteis, levantando também o ponto teórico basilar de que a proteção de copyright (assim como a de direitos autorais pela Lei 9.610/98) se limita à expressão em si de uma ideia, e não à ideia propriamente dita. Dessa forma, o uso das obras para treinamento dos modelos não resultaria, necessariamente, em trabalhos transformativos, sendo caracterizado como fair use, ou uso justificado e, portanto, não infringente.

 

As rés valem-se de importante jurisprudência da Corte de Apelação do Segundo Circuito, que reconheceu em Authors Guild v. Google que a digitalização pela plataforma de pesquisas de obras protegidas por direitos autorais e inclusão de uma ferramenta de localização de palavras e pesquisas configuraria hipótese de fair use. Assim, as rés sustentam que, como corolário da referida decisão, não seria uma infração criar cópias de uma obra como um passo preliminar para desenvolver um produto novo e não infrator, mesmo que o novo produto concorra com o original.


Sugestão: O papel da Propriedade Intelectual na proteção das patentes essenciais


Entre jurisprudência, base normativa e princípios teóricos, o caso continua a evoluir de modo a forçar o endereçamento pela Corte de questões legais envolvendo inovações disruptivas e a decisão de como a sociedade, pelo judiciário, conciliará o avanço tecnológico e humano com a proteção dos direitos de propriedade intelectual tal qual como conhecidos hoje. Assim, é evidente que importantes questões estão a surgir no horizonte, independente de qual decisão seja tomada pelos tribunais norte-americanos.

 

Como apontou o relatório The Governance of Artificial Intelligence, divulgado pelo Comitê de Ciência, Inovação e Tecnologia do parlamento britânico, um possível caminho a ser adotado, caso o uso de obras protegidas para treinamento de modelos de inteligência artificial seja reconhecido como infringente, seria a elaboração de estruturas de licenciamento que permitiriam a colaboração entre profissionais do setor criativo interessados e a indústria de IA generativa. Por outro lado, o reconhecimento do fair use alegado em tela pode significar o início de mudanças na forma como se pensa, produz e consome obras artísticas, afetando setores diversos do entretenimento e demais indústrias correlatas.

 

Como se vê, ainda que a evolução tecnológica seja o objetivo maior de todo sistema de proteção e concessão de direitos de propriedade intelectual, a sua conciliação com a preservação das criações humanas parece se encontrar num equilíbrio frágil. A disrupção tem essa como a sua principal consequência. A forma como a justiça estadunidense tratará a principal questão até o momento envolvendo sistemas de inteligência artificial generativa pode ser determinante para o caminho da evolução humana, independente de qual seja ele.

 

*Gustavo Bayum de Paiva e Marina M. J. de Andrade, sócios do Bayum de Paiva & Andrade Advogados.

Add new comment

HTML Restringido

  • Allowed HTML tags: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id>
  • Lines and paragraphs break automatically.
  • Web page addresses and email addresses turn into links automatically.