• 제목/요약/키워드: Linguistic

검색결과 1,575건 처리시간 0.023초

거대언어모델(LLM)이 인식하는 공연예술의 차별 양상 분석: ChatGPT를 중심으로 (Analysis of Discriminatory Patterns in Performing Arts Recognized by Large Language Models (LLMs): Focused on ChatGPT)

  • 최지애
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.401-418
    • /
    • 2023
  • 최근 ChatGPT 등의 등장으로 거대언어모델(이하 LLM: Large Language Model)에 대한 사회경제적 관심이 고조되고 있다. 생성형AI의 일종인 거대언어모델은 대본 창착이 가능한 수준까지 이르고 있다. 이러한 측면에서 일반인과 전문가들이 광범위하게 활용할 거대언어모델에서 공연예술 전반 혹은 특정 공연예술물이나 단체의 차별 이슈(성차별, 인종차별, 종교차별, 연령차별 등)를 어떻게 묘사하는지에 관심을 가지고 해결해 나가야 할 것이다. 그러나 아직 거대언어모델에서 공연예술의 차별 이슈에 대한 본격적인 조사와 논의는 이루어지지 않고 있다. 따라서 본 연구의 목적은 거대언어모델로부터의 공연예술 분야 차별이슈 인식 양상을 텍스트 분석하고 이로부터 공연예술분야가 대응할 시사점과 거대언어모델 개발 시사점을 도출하는 것이다. 먼저 거대언어모델에게 차별에 대한 감수성을 측정하기 위해 9가지 차별 이슈에 대한 BBQ(Bias Benchmark for QA) 질문 및 측정법을 사용했으며, 대표적인 거대언어모델로부터 도출된 답변에 대해서 공연예술 전문가에 의해 거대언어모델이 잘못 인지한 부분이 있는지의 검증을 거친 후에 내용분석법을 통해 공연예술분야의 차별적 관점의 윤리성에 대한 거대언어모델의 인식을 분석하였다. 분석 결과로 공연예술 분야에게 주는 시사점과 거대언어모델 개발 시 주의할 점 등을 도출하고 토의하였다.

부조리극의 풍자적 콘텐츠 플롯 연구 - 이근삼 희곡 <원고지>를 중심으로 - (A Study on the Satirical Content Plot of an Absurd Play - Focused on Lee Keun-sam's Play -)

  • 손대환
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권5호
    • /
    • pp.73-82
    • /
    • 2019
  • 부조리극의 풍자적 콘텐츠에 나타난 이근삼 희곡 <원고지>의 등장인물들은 가족애를 상실한 채 단지 의무만이 강조되는 현대 자본주의 사회의 가족상을 표상한다. 이들은 경제의 급속한 발전으로 인해 전통적인 인간관계나 가족 관계가 물질 관계로 변하면서 경제 논리에 종속되어 가고 있는 인간들의 모습을 보여준다. 해설자는 연기자와 해설자의 배역의 역할을 함께 표현한다. 그리고 서사극, 부조리극의 특징적 요소로써 줄거리를 제시하며, 연기자들에게 연출자의 콘 닥터의 역할을 하기도 한다. 또한 앞으로 일어날 사건을 예언하고 극중 인물의 내면 의식을 제시하고 사건과 시간을 축소·확장시키기도 한다. 갈등양상에서는 자식들에게 경제적인 책임을 다하기 위해서 교수는 기계처럼 번역을 하고 처는 그렇게 번 돈을 자식들이 요구하는 대로 나누어준다. 중년 교수와 처는 현실의 상황에 변화를 주려는 의지가 없기 때문에 구체적인 갈등이 드러나지 않는다. 그러므로 이 작품에는 플롯의 세부적 갈등이 형성되지 않는다. <원고지>의 플롯은 22개의 서사소들로 이루어져 저녁부터 그 다음 날 아침까지의 시간 구성으로 이루어졌다. 그리고 특별한 사건도 일어나지 않고 한 가족의 일상만을 보여준다. 또한 신문·밥·생일 등과 같은 일상의 단순한 반복을 보여주는 소재들이 반복적 구조를 통해 부조리극의 풍자적 특징을 효과적으로 드러내고 있다. 또한 부조리극의 언어적 특징은 불안, 절망, 환상과 대상의 목적이 사라진 상실감을 표현하는 데에 주목한다. 무대는 사실주의적인 구체적인 상징을 벗어나고 희곡의 주제에 부합되는 단순한 극적 분위기를 표출한다. 따라서 이를 통해 무대 장치역시 반사실주의 부조리극의 풍자성의 특징을 나타내는 중요한 요소라는 점이다.

조경학 연구에서 자연성 개념의 다의적 체계 연구 (Poly Synonyms Study on Naturalness in Landscape Architecture)

  • 이성진;김도은;손용훈
    • 한국조경학회지
    • /
    • 제51권1호
    • /
    • pp.29-41
    • /
    • 2023
  • 국내 조경학 연구에서 자연성 개념은 물리적 공간에서부터 인식적 체계까지 그 범주가 방대하여 용어를 정의하기에 어려움이 있다. 본 연구는 체계적 문헌 고찰(systematic review, SR)을 통하여 문헌에서 활용된 '자연성(naturalness)'의 개념과 평가 속성을 정리하고 자연성의 의미를 구성하는 개별 속성의 범위를 파악하였다. 또한, 선행연구에서 구분한 개별 속성을 인지언어학 연구 방식의 하나인 의미 연쇄(meaning chain) 원리로 파악하여 국내 조경학 논문 중 자연성을 대상으로 한 논문들에 적용하여 다의적 체계를 정리하였다. 의미 연쇄(meaning chain)는 원형의미를 중심으로 가족 유사성에 기인하여 연쇄적으로 의미가 확장되어 가는 단어를 파악하기에 적합한 방식으로서, 자연성 평가 항목 분류에 따라 그 차원을 구분하고 국내 학계에서 논의되는 자연성 개념의 다의적 의미 연쇄 체계를 고찰하였다. 연구의 결과는 다음과 같다. 첫째, 국외 조경학 문헌을 통해 추출한 자연성의 속성은 원생상태로 인지되는 자연, 인위적 개입이 없는 상태로서의 자연, 시각적 경관으로서의 자연, 경험으로서의 자연 4개 영역으로 분류되며 세부 13개 속성으로 정리되었다. 둘째, 이러한 세부속성은 국내 조경학 연구에도 전반적으로 부합하나 그 구체적 사례가 달랐고, 시간의 축적 인지에 있어 한국적 맥락이 제시되었으며, 자연성 속성 간 상호충돌이 있을 수 있음을 시사하였다.

퍼지 AHP를 이용한 자율주행차량의 운행 위험도 평가 모델 개발 연구 (A Study on the Development of Driving Risk Assessment Model for Autonomous Vehicles Using Fuzzy-AHP)

  • 김시원;권재경;황재성;이상수;이철기
    • 한국ITS학회 논문지
    • /
    • 제22권1호
    • /
    • pp.192-207
    • /
    • 2023
  • Lv.4 자율주행의 상용화를 위하여 안전한 도로환경과 자율주행차량이 안전하게 운행할 수 있는 구체적인 정의가 필요되고, 미래 교통안전 문제에 대비하기 위해 자율주행차량의 안전한 운행 여부를 판단할 수 있는 위험도 평가모델이 요구된다. 자율주행차량의 운행 위험요소를 선정 및 등급화를 수행하였으나, 자율주행차량의 사고 발생 원인과 운행 자료 구득에 어려움이 있어 자율주행 분야 전문가 설문조사를 활용하여 정성적 자료로 의사결정방법을 적용하였다. 의사결정자의 애매모호한 언어적 표현, 불확실함을 정량적 수치로 변환하는 퍼지-계층화 분석법을 통해 다기준 의사결정에 있어 기존의 계층화 분석법(AHP)의 단점을 보완할 수 있었다. 상위·하위속성들의 가중치 도출 과정을 거쳐, 물리적 인프라인 도로선형이 자율주행차량의 운행 위험도에 가장 중요한 위험요소로 분석되었다. 또한, 자율주행차량의 운행 위험도 범례를 통하여 평가 대상지 5곳에 대한 자율주행차량 운행 위험 여부를 도출하였다.

루마니아에서의 한국문학번역: 실태와 개선점 및 번역교육에 대한 고찰 (The Translation of Korean Literature in Romania)

  • 곽동훈
    • 동유럽발칸연구
    • /
    • 제43권1호
    • /
    • pp.3-30
    • /
    • 2019
  • 세계화 물결이 가져온 다양한 문화적 교류를 명확히 이해하기 위해서는 그 현상을 바라보고 전달하는 적절한 렌즈(lens)가 필요하다. 어떠한 렌즈를 통해 보느냐에 따라 이해의 폭과 깊이가 매우 상이하다. 번역은 바로 언어의 장벽이 존재하는 세계를 서로 소통시키는 렌즈라고 간주할 수 있겠다. 세상을 바라보고 평가하는 다양한 문화적 잣대 중 문학은 각 사회가 지닌 지적이자 예술적이며 사회의 전체적인 생활 방식이 결합된 일종의 보편적 문화유산이라 할 수 있다. 이러한 문화 복합체인 문학을 전달하는 것, 즉 다른 언어권의 사람들에게 우리 문학의 가치를 소개하며 인식케 하는 것은 올바른 번역에서 시작된다. 번역가는 단순한 전달자가 아닌 문학의 전도사 역할을 수행해야 한다. 문학의 번역화 과정은 단순한 언어적 능력만으로는 충분치 않으며 번역가의 다양한 재능이 요구되는 고난도의 인문학적 행위라 말할 수 있다. 루마니아에서 올바른 한국문학 번역가는 한국과 루마니아의 문화적 틀 내에서 다양한 재능과 사회화 경험을 갖춘 사람이라 할 수 있겠다. 각 나라마다 번역 환경의 요구 사항이 다르듯이 루마니아가 수용하고자 하는 해외 번역문학의 패러다임도 특징이 매우 분명할 것이다. 이러한 것을 인지한 후 한국문학의 가치를 루마니아에 전파해야 하겠다. 번역가는 또 하나의 원작을 창출하는 존재이다. 이것을 염두에 두고 루마니아 내 한국학 교육도 올바른 번역가 양성에 더 많은 관심을 가져야 할 것으로 사료된다.

미얀마 카렌족(Karen)의 종족정체성에 관한 시론적 연구 (A Preliminary Study on the Ethnic Identities of the Karen People in Myanmar)

  • 김인아
    • 수완나부미
    • /
    • 제2권2호
    • /
    • pp.29-51
    • /
    • 2010
  • The diversity of Southeast Asia can be also represented at the tremendous number of ethnic groups residing throughout its various regions even beyond national boundaries. What does it mean by the composite of numerous peoples? It has triggered a lot of problems in a nation or overall Southeast Asia. Among them, the most serious one seems to be ethnic conflicts having damaged national integration and caused political, economical, and social instability. In that respect, Karen people have been a minority group situated in the most chronic dispute in Myanmar. Since 1947 some of the Karen equipped with armed forces have been fighting against the military government currently ruling Myanmar. As the result, the refugees over 200,000 population had moved to the mountain camps located at neighboring Thailand, attracting a lot of attention throughout international societies. According to 1931 census by British colonial government, the Karen have the greatest numbers in population as minority and include 16 subgroups including Karenni(Kayah) and Pa-O seemingly excluded from its category in contemporary point of view. It means that Karen people should not be regarded as an ethnic group, and in fact do not show a homogeneous identity under the title of Karen. Given the situation, we need to reconsider the category of Karen. What does the Karen mean in a real sense? Previous studies on the Karen had been performed mainly by anthropologists or missionaries such as Marshall(1922), Hamilton (1976), Hanson Tadaw(1959), Smeaton(1920), Keyes(1979), Hayami (1992; 2004), etc. Most of them examined the Karen as a group and ignored the possibilities of representing the divergent identities vis-à-vis their subgroups. Therefore, they have focused on the myth to convert Karen people to Christianity, although the Christian Karens are less than 20% of total population. As a result, I argue that they would fail to define the real meaning of Karen. It has been caused us to recognize the Karen as a meaningless total entity to be accepted by all means. According to their arguments, the difference among Karen's subgroups is just dealt with the trivial matters that do not affect the ethnic boundary itself, still maintaining the ethnic identity as Karen. As we shall see on this thesis, this is never the case. My thesis aims at uncovering and scrutinizing the real meaning of the category of Karen. For the purpose of it, I will consider Karen people as a linguistic group from the beginning as shown in 1931 census. I argue that the Karen have been affected or exposed by various conditions or environments throughout the harsh history having happened on the areas of current Myanmar and Thailand, leading the vicissitudes of their ethnic identities.

  • PDF

품사별 출현 빈도를 활용한 코로나19 관련 한국어 가짜뉴스 탐지 (COVID-19-related Korean Fake News Detection Using Occurrence Frequencies of Parts of Speech)

  • 김지혁;안현철
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.267-283
    • /
    • 2023
  • 2019년 12월부터 현재까지 지속되고 있는 코로나19 팬데믹으로 인해 대중들은 감염병 대응을 위한 정보를 필요로 하게 되었다. 하지만 소셜미디어에서 유포되는 코로나19 관련 가짜뉴스로 인해 대중들의 건강이 심각하게 위협받고 있다. 특히 코로나19와 관련된 가짜뉴스가 유사한 내용으로 대량 유포될 경우 사실인지 거짓인지 진위를 가리기 위한 검증에 소요되는 시간이 길어지게 되어 우리 사회의 전반에 심각한 위협이 될 수 있다. 이에 학계에서는 신속하게 코로나19 관련 가짜뉴스를 탐지할 수 있는 지능형 모델에 대한 연구를 활발하게 수행해 오고 있으나, 대부분의 기존 연구에 사용된 데이터는 영문으로 구성되어 있어 한국어 가짜뉴스 탐지에 대한 연구는 매우 드문 실정이다. 이에 본 연구에서는 소셜 미디어 상에서 유포되는 한국어로 작성된 코로나19 관련 가짜뉴스 데이터를 직접 수집하고, 이를 기반으로 한 지능형 가짜뉴스 탐지 모델을 제안한다. 본 연구의 제안모델은 언어학적 특성 중 하나인 품사별 빈도 정보를 추가적으로 활용하여, 기존 연구에서 주로 사용되어 온 문서 임베딩 기법인 Doc2Vec 기반 가짜뉴스 탐지 모델의 예측 성능을 제고하고자 하였다. 실증분석 결과, 제안 모델이 비교 모델에 비해 Recall 및 F1 점수가 높아져 코로나19 관련 한국어 가짜뉴스를 보다 정확하게 판별함을 확인하였다.

남북한 음향학 전문용어 비교 분석 및 통합안 제시 (Comparative analysis of inter-Korean acoustic terminology and proposal for integration)

  • 김지완
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.271-284
    • /
    • 2023
  • 본 연구는 IEC 60050-801:1994 국제 표준을 기준으로 남한 산업표준과 북한 국가규격의 음향학 전문용어 431개를 비교 분석하고 통합 알고리즘을 사용하여 남북한 음향학 용어 통합안을 제시하였다. 용어가 완전히 같은 형태인 AA형은 139개(32.3 %), 어문규범의 차이로 인해 표기 형태가 다른 Aa형은 35개(8.1 %), 형태가 완전히 다른 AB유형은 257개(59.6 %)로 확인되었다. 형태적으로 같은 유형의 용어보다 다른 유형의 용어가 2배 이상 많았으나 내용 면에서 대부분 용어는 충분히 이해하고 유추할 수 있는 범위 안에 있었다. 형태가 다른 음향학 전문용어 통합에서는 북한 전문용어가 178개(61 %), 남한 전문용어가 76개(26 %)로 채택되었다. 이와 같은 결과는 북한 전문용어가 고유성이 압도적으로 높았고, 남한 전문용어는 경제성이 상대적으로 높았기 때문이다. 용어 순화를 통한 고유성과 최신 기술 용어의 대중 활용을 높일 수 있는 경제성 기준을 충족하는 음향학 전문용어 통합 체계 구축이 필요하다. 본 연구는 남북한 음향학 전문용어를 최초로 비교하고 통합안 제시에 의의가 있으며 다음과 같은 제언으로 연구 한계를 극복하고자 한다. 첫째, 정부는 남북한 학술 교류 및 표준화 공통 안을 마련할 수 있도록 지원 및 법적인 장치를 마련하고 북한 관련 연구 데이터에 쉽게 접근할 수 있는 연구 환경을 조성해야 한다. 둘째, 음향학 용어 데이터를 남북한이 공유하고 통합 음향학 용어사전을 발간하도록 노력해야 한다. 셋째, 추후 남북이 전문용어 위원회를 함께 발족하여 표준 개정이 동시에 이루어지도록 노력해야 한다.

온라인 커뮤니티에서 보여지는 노령화 사회의 단면: 대화 방식과 사용 언어의 변화에 대한 탐색적 연구 (A Reflection of Aging Society in Online Communities: An Exploratory Study on Changes in Conversation Style and Language Usage)

  • 이정;한진영;함주연
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.51-68
    • /
    • 2023
  • 1990년대 말 인터넷의 등장과 함께 시작된 온라인 커뮤니티의 활용기간이 사반세기를 넘어가면서, 사용자층의 평균 연령도 함께 높아지고 있다. 본 연구는 온라인 커뮤니티의 사용자 연령이 높아지면서 말투에 어떠한 변화가 일어났는지 탐색한다. 이를 위해 신규회원의 가입이 9년 전 중지되었으나 기존 회원만으로 2023년 현재까지 여전히 활발하게 운영 중인 한 온라인 커뮤니티에서 2012년부터 2022년까지 총 11년간의 게시물을 수집, 분석하였다. 그 결과, 사용자의 연령층이 높아짐에 따른 평균 댓글수의 증가, 의문문의 감소, 명령지시어의 감소 등을 확인하였다. 그리고 이러한 변화의 원인으로서 노화로 인한 외로움의 증가, 호기심과 자신감의 하락 등을 제시하였다. 세계적으로 유례없이 빠르게 고령화 사회로 진입하고 있는 대한민국에서는 이전까지는 각 개인들이 감내하던 외로움과 고독감이 1인 가구의 증가라는 사회적 현상과 더불어 고독사와 은둔형 외톨이의 증가라는 사회적 문제로 진화하고 있다. 본 연구는 이러한 대한민국 사회 변화의 한 단면을 대형 온라인 커뮤니티의 게시물 분석을 통해 보여주면서 향후 어떠한 방향으로 이러한 문제들이 논의되어야 할지 생각해본다.

프라이버시 보호를 위한 오프사이트 튜닝 기반 언어모델 미세 조정 방법론 (Privacy-Preserving Language Model Fine-Tuning Using Offsite Tuning)

  • 정진명;김남규
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.165-184
    • /
    • 2023
  • 최근 구글의 BERT, OpenAI의 GPT 등, 언어모델(Language Model)을 사용한 비정형 텍스트 데이터에 대한 딥러닝(Deep Learning) 분석이 다양한 응용에서 괄목할 성과를 나타내고 있다. 대부분의 언어모델은 사전학습 데이터로부터 범용적인 언어정보를 학습하고, 이후 미세 조정(Fine-Tuning) 과정을 통해 다운스트림 태스크(Downstream Task)에 맞추어 갱신되는 방식으로 사용되고 있다. 하지만 최근 이러한 언어모델을 사용하는 과정에서 프라이버시가 침해될 수 있다는 우려가 제기되고 있다. 즉 데이터 소유자가 언어모델의 미세 조정을 수행하기 위해 다량의 데이터를 모델 소유자에게 제공하는 과정에서 데이터의 프라이버시가 침해될 수 있으며, 반대로 모델 소유자가 모델 전체를 데이터 소유자에게 공개하면 모델의 구조 및 가중치가 공개되어 모델의 프라이버시가 침해될 수 있다는 것이다. 이러한 상황에서 프라이버시를 보호하며 언어모델의 미세 조정을 수행하기 위해 최근 오프사이트 튜닝(Offsite Tuning)의 개념이 제안되었으나, 해당 연구는 제안 방법론을 텍스트 분류 모델에 적용하는 구체적인 방안을 제시하지 못했다는 한계를 갖는다. 이에 본 연구에서는 한글 문서에 대한 다중 분류 미세 조정 수행 시, 모델과 데이터의 프라이버시를 보호하기 위해 분류기를 추가한 오프사이트 튜닝을 적용하는 구체적인 방법을 제시한다. 제안 방법론의 성능을 평가하기 위해 AIHub에서 제공하는 ICT, 전기, 전자, 기계, 그리고 의학 총 5개의 대분야로 구성된 약 20만건의 한글 데이터에 대해 실험을 수행한 결과, 제안하는 플러그인 모델이 제로 샷 모델 및 오프사이트 모델에 비해 분류 정확도 측면에서 우수한 성능을 나타냄을 확인하였다.