About

Lingcam - 言葉で現像するカメラ

“言葉で現像するカメラ”は、言葉を元に写真を再構成するカメラである。言語設定ダイヤルによって指定された言語を元に、ChatGPTによって写真中の全ての構成要素を言語化したのち、その言葉を翻訳することなくそのままプロンプトとして用いて写真を生成する。 多くの画像生成AIは多言語対応が進んでおり、我々は意識することなく高性能な画像生成AIの恩恵を受けることができるが、 それは一度英語に翻訳されたプロンプトを経て生成されたものであり、最終的に英語によって画像が生成されるという言語のバイアスを受けたものである。 言語を翻訳せずにそのままプロンプトとして入力することで、生成に失敗することもあれば、言語がもつ背景を意識したような生成が実現することもある。 人は言葉を通して世界を認識していると言われるように、言語を明示的に機能としてもつカメラによって、言語のバイアスを明らかにした。
Lingcam is a camera that reconstructs photos based on words. Based on the language specified by the language setting dial, ChatGPT verbalizes all components of a photo, and then generates a photo using the words as prompts without translating them. Many image generation AIs are becoming multilingual, and we can benefit from high-performance image generation AI without even realizing it, but they are generated through prompts that are once translated into English, and are subject to language bias in that the image is ultimately generated in English. By inputting the language as a prompt without translating it, generation may fail, or it may be possible to generate something that takes into account the background of the language. As people are said to recognize the world through words, a camera that explicitly has language as a function has revealed language bias.

Камера, у которой есть только языковые настройки, — это камера, которая восстанавливает фотографии на основе слов. В зависимости от языка, указанного диском настройки языка, все составляющие элементы фотографии переводятся на язык с помощью ChatGPT, а затем фотография создается с использованием слов в качестве подсказки без перевода. Многие ИИ для создания изображений становятся многоязычными, и мы можем извлечь выгоду из высокопроизводительного ИИ для создания изображений, даже не осознавая этого. Оно было создано с помощью подсказки, которая когда-то была переведена на английский язык, и подверглась языковой предвзятости, что в конечном итоге привело к тому, что изображение было создано на английском языке. Если вы введете язык в том виде, в каком он есть, без его перевода, генерация может завершиться неудачно, или вы сможете сгенерировать что-то, что будет учитывать предысторию языка. Говорят, что люди воспринимают мир через слова, поэтому, используя камеру, которая напрямую взаимодействует с языком, мы выявили предвзятость языка.
只有語言設定的相機是根據文字重建照片的相機。根據語言設定轉盤指定的語言,使用ChatGPT將照片的所有構成元素翻譯成語言,然後以文字作為提示產生照片,無需翻譯。 許多圖像生成人工智慧正在變得多語言,我們甚至可以在沒有意識到的情況下從高效能圖像生成人工智慧中受益。 它是透過曾經被翻譯成英語的提示生成的,並且受到語言偏見的影響,最終導致圖像由英語生成。 如果您按原樣輸入語言作為提示而不進行翻譯,則生成可能會失敗,或者您可能能夠產生考慮到該語言背景的內容。 據說人類透過文字感知世界,因此透過使用與語言明確運作的相機,我們揭示了語言的偏見。

एक कैमरा जिसमें केवल भाषा सेटिंग्स होती हैं वह एक ऐसा कैमरा होता है जो शब्दों के आधार पर तस्वीरों का पुनर्निर्माण करता है। भाषा सेटिंग डायल द्वारा निर्दिष्ट भाषा के आधार पर, फोटो के सभी घटक तत्वों को चैटजीपीटी का उपयोग करके भाषा में अनुवादित किया जाता है, और फिर अनुवाद के बिना संकेत के रूप में शब्दों का उपयोग करके फोटो तैयार किया जाता है। कई छवि निर्माण एआई बहुभाषी होते जा रहे हैं, और हम उच्च-प्रदर्शन छवि निर्माण एआई से बिना इसका एहसास किए भी लाभ उठा सकते हैं। यह एक संकेत के माध्यम से उत्पन्न हुआ था जिसे एक बार अंग्रेजी में अनुवादित किया गया था, और एक भाषा पूर्वाग्रह के अधीन था जिसके परिणामस्वरूप अंततः छवि अंग्रेजी द्वारा उत्पन्न हुई थी। यदि आप भाषा को अनुवाद किए बिना उसी रूप में इनपुट करते हैं, जैसे वह है, तो पीढ़ी विफल हो सकती है, या आप कुछ ऐसा उत्पन्न करने में सक्षम हो सकते हैं जो भाषा की पृष्ठभूमि को ध्यान में रखता है। ऐसा कहा जाता है कि मनुष्य दुनिया को शब्दों के माध्यम से समझता है, इसलिए एक कैमरे का उपयोग करके जो स्पष्ट रूप से भाषा के साथ काम करता है, हमने भाषा के पूर्वाग्रह को उजागर किया।
Una cámara que sólo tiene configuración de idioma es una cámara que reconstruye fotografías basándose en palabras. Según el idioma especificado por el dial de configuración de idioma, todos los elementos constituyentes de la foto se traducen al idioma usando ChatGPT y luego la foto se genera usando las palabras como mensaje sin traducción. Muchas IA de generación de imágenes se están volviendo multilingües y podemos beneficiarnos de una IA de generación de imágenes de alto rendimiento sin siquiera darnos cuenta. Se generó a través de un mensaje que una vez se tradujo al inglés y estuvo sujeto a un sesgo del idioma que finalmente resultó en que la imagen se generara en inglés. Si ingresa el idioma tal como está como mensaje sin traducirlo, la generación puede fallar o puede generar algo que tenga en cuenta los antecedentes del idioma. Se dice que los humanos percibimos el mundo a través de las palabras, por lo que al usar una cámara que funciona explícitamente con el lenguaje, revelamos el sesgo del lenguaje.

"언어 설정밖에 없는 카메라"는 단어를 바탕으로 사진을 재구성하는 카메라이다. 언어 설정 다이얼에 의해 지정된 언어를 바탕으로, ChatGPT에 의해 사진중의 모든 구성 요소를 언어화한 후, 그 단어를 번역하지 않고 그대로 프롬프트로서 이용해 사진을 생성한다. 많은 이미지 생성 AI는 다국어 대응이 진행되고 있으며, 우리는 의식하지 않고 고성능의 이미지 생성 AI의 혜택을 받을 수 있지만, 그것은 한 번 영어로 번역된 프롬프트를 거쳐 생성된 것이며, 결국 영어에 의해 이미지가 생성된다는 언어의 바이어스를 받은 것이다. 언어를 번역하지 않고 그대로 프롬프트로 입력함으로써 생성에 실패하는 경우도 있고, 언어가 가지는 배경을 의식한 것 같은 생성이 실현되는 경우도 있다. 사람은 말을 통해 세계를 인식하고 있다고 말하는 것처럼 언어를 명시적으로 기능으로 하는 카메라에 의해 언어의 바이어스를 밝혔다.
Un appareil photo doté uniquement de paramètres de langue est un appareil photo qui reconstruit des photos à partir de mots. En fonction de la langue spécifiée par le bouton de réglage de la langue, tous les éléments constitutifs de la photo sont traduits dans la langue à l'aide de ChatGPT, puis la photo est générée en utilisant les mots comme invite sans traduction. De nombreuses IA de génération d’images deviennent multilingues, et nous pouvons bénéficier d’une IA de génération d’images performante sans même nous en rendre compte. Il a été généré via une invite qui a été une fois traduite en anglais et a été soumis à un biais linguistique qui a finalement abouti à ce que l'image soit générée en anglais. Si vous saisissez la langue telle quelle comme invite sans la traduire, la génération peut échouer ou vous pourrez peut-être générer quelque chose qui prend en compte l'arrière-plan de la langue. On dit que les humains perçoivent le monde à travers les mots. Ainsi, en utilisant un appareil photo qui fonctionne explicitement avec le langage, nous avons révélé le biais du langage.

Credit

Masaru Mizuochi
Concept, Software

© All Rights Reserved. Designed by GetTemplates