CC is a small nonprofit fighting for the open web. We need your support to continue our work. Donate today!
Making AI Work for Creators and the Commons
Better Internet, Community, Events, Licenses & Tools, Open Culture, Open Knowledge, Technology[lee esta entrada en español >]
On the eve of the CC Global Summit, members of the CC global community and Creative Commons held a one-day workshop to discuss issues related to AI, creators, and the commons. The community attending the Summit has a long history of hosting these intimate discussions before the Summit begins on critical and timely issues.
Emerging from that deep discussion and in subsequent conversation during the three days of the Summit, this group identified a set of common issues and values, which are captured in the statement below. These ideas are shared here for further community discussion and to help CC and the global community navigate uncharted waters in the face of generative AI and its impact on the commons.
Background considerations
- Recognizing that around the globe the legal status of using copyright protected works for training generative AI systems raises many questions and that there is currently only a limited number of jurisdictions with relatively clear and actionable legal frameworks for such uses. We see the need for establishing a number of principles that address the position of creators, the people building and using machine learning (ML) systems, and the commons, under this emerging technological paradigm.
- Noting that there are calls from organized rightholders to address the issues posed by the use of copyrighted works for training generative AI models, including based on the principles of credit, consent, and compensation.
- Noting that the development and deployment of generative AI models can be capital intensive, and thus risks resembling (or exacerbating) the concentration of markets, technology, and power in the hands of a small number of powerful for-profit entities largely concentrated in the United States and China, and that currently most of the (speculative) value accrues to these companies.
- Further noting that, while the ability for everyone to build on the global information commons has many benefits, the extraction of value from the commons may also reinforce existing power imbalances and in fact can structurally resemble prior examples of colonialist accumulation.
- Noting that this issue is especially urgent when it comes to the use of traditional knowledge materials as training data for AI models.
- Noting that the development of generative AI reproduces patterns of the colonial era, with the countries of the Global South being consumers of Northern algorithms and data providers.
- Recognizing that some societal impacts and risks resulting from the emergence of generative AI technologies need to be addressed through public regulation other than copyright, or through other means, such as the development of technical standards and norms. Private rightsholder concerns are just one of a number of societal concerns that have arisen in response to the emergence of AI.
- Noting that the development of generative AI models offers new opportunities for creators, researchers, educators, and other practitioners working in the public interest, as well as providing benefits to a wide range of activities across other sectors of society. Further noting that generative AI models are a tool that enables new ways of creation, and that history has shown that new technological capacities will inevitably be incorporated into artistic creation and information production.
Principles
We have formulated the following seven principles for regulating generative AI models in order to protect the interests of creators, people building on the commons (including through AI), and society’s interests in the sustainability of the commons:
- It is important that people continue to have the ability to study and analyse existing works in order to create new ones. The law should continue to leave room for people to do so, including through the use of machines, while addressing societal concerns arising from the emergence of generative AI.
- All parties should work together to define ways for creators and rightsholders to express their preferences regarding AI training for their copyrighted works. In the context of an enforceable right, the ability to opt out from such uses must be considered the legislative ceiling, as opt-in and consent-based approaches would lock away large swaths of the commons due to the excessive length and scope of copyright protection, as well as the fact that most works are not actively managed in any way.
- In addition, all parties must also work together to address implications for other rights and interests (e.g. data protection, use of a person’s likeness or identity). This would likely involve interventions through frameworks other than copyright.
- Special attention must be paid to the use of traditional knowledge materials for training AI systems including ways for community stewards to provide or revoke authorisation.
- Any legal regime must ensure that the use of copyright protected works for training generative AI systems for noncommercial public interest purposes, including scientific research and education, are allowed.
- Ensure that generative AI results in broadly shared economic prosperity – the benefits derived by developers of AI models from access to the commons and copyrighted works should be broadly shared among all contributors to the commons.
- To counterbalance the current concentration of resources in the the hands of a small number of companies these measures need to be flanked by public investment into public computational infrastructures that serve the needs of public interest users of this technology on a global scale. In addition there also needs to be public investment into training data sets that respect the principles outlined above and are stewarded as commons.
In keeping with CC’s practice to provide major communications related to the 2023 Global Summit held in Mexico City in English and Spanish, following is the text of this post originally created in English translated to Spanish
Hacer que la IA funcione para los creadores y los bienes comunes
En vísperas de la Cumbre Global CC, los miembros de la comunidad global CC y Creative Commons celebraron un taller de un día para discutir cuestiones relacionadas con la IA, los creadores y los bienes comunes. La comunidad que asiste a la Cumbre tiene una larga historia de albergar estas discusiones íntimas antes de que comience la Cumbre sobre temas críticos y oportunos.
Como resultado de esa profunda discusión y de la conversación posterior durante los tres días de la Cumbre, este grupo identificó un conjunto de cuestiones y valores comunes, que se recogen en la siguiente declaración. Estas ideas se comparten aquí para una mayor discusión comunitaria y para ayudar a CC y a la comunidad global a navegar por aguas inexploradas frente a la IA generativa y su impacto en los bienes comunes.
Consideraciones preliminares
- Reconociendo que en todo el mundo el estatus legal del uso de obras protegidas por derechos de autor para entrenar sistemas generativos de IA plantea muchas preguntas y que actualmente solo hay un número limitado de jurisdicciones con marcos legales relativamente claros y viables para tales usos. Vemos la necesidad de establecer una serie de principios que aborden la posición de los creadores, las personas que construyen y utilizan sistemas de aprendizaje automático y los bienes comunes, bajo este paradigma tecnológico emergente.
- Señalando que hay llamados de titulares de derechos organizados para abordar los problemas que plantea el uso de obras protegidas por derechos de autor para entrenar modelos de IA generativa, incluso basados en los principios de crédito, consentimiento y compensación.
- Observando que el desarrollo y despliegue de modelos generativos de IA puede requerir mucho capital y, por lo tanto, corre el riesgo de asemejarse (o exacerbar) la concentración de mercados, tecnología y poder en manos de un pequeño número de poderosas entidades con fines de lucro concentradas en gran medida en los Estados Unidos y China, y que actualmente la mayor parte del valor (especulativo) corresponde a estas empresas.
- Señalando además que, si bien la capacidad de todos para aprovechar los bienes comunes globales de información tiene muchos beneficios, la extracción de valor de los bienes comunes también puede reforzar los desequilibrios de poder existentes y, de hecho, puede parecerse estructuralmente a ejemplos anteriores de acumulación colonialista.
- Señalando que esta cuestión es especialmente urgente cuando se trata del uso de materiales de conocimientos tradicionales como datos de entrenamiento para modelos de IA.
- Señalando que el desarrollo de la IA generativa reproduce patrones de la era colonial, siendo los países del Sur Global consumidores de algoritmos y proveedores de datos del Norte.
- Reconocer que algunos impactos y riesgos sociales resultantes del surgimiento de tecnologías de IA generativa deben abordarse mediante regulaciones públicas distintas de los derechos de autor, o por otros medios, como el desarrollo de estándares y normas técnicas. Las preocupaciones de los titulares de derechos privados son sólo una de una serie de preocupaciones sociales que han aparecido en respuesta al surgimiento de la IA.
- Señalando que el desarrollo de modelos generativos de IA ofrece nuevas oportunidades para creadores, investigadores, educadores y otros profesionales que trabajan en el interés público, además de brindar beneficios a una amplia gama de actividades en otros sectores de la sociedad. Señalando además que los modelos generativos de IA son una herramienta que permite nuevas formas de creación, y que la historia ha demostrado que inevitablemente se incorporarán nuevas capacidades tecnológicas a la creación artística y la producción de información.
Principios
Hemos formulado los siguientes siete principios para regular los modelos de IA generativa con el fin de proteger los intereses de los creadores, las personas que construyen sobre los bienes comunes (incluso a través de la IA) y los intereses de la sociedad en la sostenibilidad de los bienes comunes:
- Es importante que la gente siga teniendo la capacidad de estudiar y analizar obras existentes para crear otras nuevas. La ley debería seguir dejando espacio para que las personas lo hagan, incluso mediante el uso de máquinas, al tiempo que aborda las preocupaciones sociales que aparecen por el surgimiento de la IA generativa.
- Todas las partes deberían trabajar juntas para definir formas para que las personas creadoras y quienes son titulares de derechos expresen sus preferencias con respecto a la capacitación en IA para sus obras protegidas por derechos de autor. En el contexto de un derecho exigible, la capacidad de hacer un “opt out” de tales usos debe considerarse el límite legislativo, ya que los enfoques basados en la aceptación voluntaria y el consentimiento bloquearían grandes sectores de los bienes comunes debido a la duración y el alcance excesivos de la protección de los derechos de autor, así como el hecho de que la mayoría de las obras no están siendo activamente gestionadas.
- Además, todas las partes también deben trabajar juntas para abordar las implicaciones para otros derechos e intereses (por ejemplo, protección de datos, uso de la imagen o identidad de una persona). Esto probablemente implicaría intervenciones a través de marcos distintos del derecho de autor.
- Se debe prestar especial atención al uso de materiales del conocimiento tradicional para entrenar sistemas de IA, incluidas formas para que los custodios de las comunidades proporcionen o revoquen la autorización.
- Cualquier régimen legal debe garantizar que se permita el uso de obras protegidas por derechos de autor para entrenar sistemas generativos de IA con fines no comerciales de interés público, incluidas la investigación científica y la educación.
- Garantizar que la IA generativa dé como resultado una prosperidad económica ampliamente compartida: los beneficios que obtienen los desarrolladores de modelos de IA del acceso a los bienes comunes y a las obras protegidas por derechos de autor deben compartirse ampliamente entre quienes contribuyen a los bienes comunes.
- Para contrarrestar la actual concentración de recursos en manos de un pequeño número de empresas, estas medidas deben ir acompañadas de inversión pública en infraestructuras computacionales públicas que satisfagan las necesidades de los usuarios de interés público de esta tecnología a escala global. Además, también es necesario invertir públicamente en sets de datos de entrenamiento que respeten los principios descritos anteriormente y se administren como bienes comunes.
Like the rest of the world, CC has been watching generative AI and trying to understand the many complex issues raised by these amazing new tools. We are especially focused on the intersection of copyright law and generative AI. How can CC’s strategy for better sharing support the development of this technology while also respecting the work of human creators? How can we ensure AI operates in a better internet for everyone? We are exploring these issues in a series of blog posts by the CC team and invited guests that look at concerns related to AI inputs (training data), AI outputs (works created by AI tools), and the ways that people use AI. Read our overview on generative AI or see all our posts on AI.
Note: We use “artificial intelligence” and “AI” as shorthand terms for what we know is a complex field of technologies and practices, currently involving machine learning and large language models (LLMs). Using the abbreviation “AI” is handy, but not ideal, because we recognize that AI is not really “artificial” (in that AI is created and used by humans), nor “intelligent” (at least in the way we think of human intelligence).