• 제목/요약/키워드: Linguistic Analysis

검색결과 524건 처리시간 0.024초

체험 이야기하기의 구술적 특성에 대하여 (A Study on the Oral Characteristics in Personal Narrative Storytelling)

  • 김경섭
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.143-150
    • /
    • 2022
  • 현대 이야기 현장에 살아 숨 쉬는 언어 민속은 옛이야기가 아니라 개인의 체험을 이야기하는 개인서사라 할 수 있다. 이러한 개인서사는 구비문학 내의 여러 장르들처럼 창조의 충동으로부터 발생하기보다는 전달과 재창조의 충동에서 발생하는 것이 대부분이다. 전통적인 옛이야기에 비해 개인서사와 같은 체험에 대한 이야기의 경우 구연을 담당하는 이야기 화자 개인의 성향이 더해져서 연행되는 경우가 많다. 이 과정에서 '체험을 어림잡아 재단하고, 추억을 주먹구구식으로 재해석'하는 현상이 발생하게 되고, 이는 구비문학을 구비문학이게끔 하는 중요한 요소이다. 문제는 구연 현장에서 필연적으로 포착되는 이러한 유의미한 요소들을 어떻게 다룰지이다. 본 논문의 주요 방법론인 텍스트 언어학은 이러한 구비문학의 즉흥적인 요소들을 포착해 낼 가능성을 내포하고 있다. 개인서사에 대한 텍스트 언어학적 분석은 현장의 분위기, 화자의 실수, 이야기 내용의 모순, 청중의 반응 등 그동안 구비문학 연구에서 다루기 힘들었던 구술적 특성들을 좀 더 다른 각도에서 논의할 가능성을 제공한다. 이를 통해 '말'이라는 일회성, '어림셈'이라는 현장성, '대중의 지혜'라는 적층성을 기반으로 하는 구비문학의 구술시학을 효과적으로 논의할 수 있다. 나아가 공동체 문화에서 개개인의 언어 예술의 중요한 부분을 담당하는 체험 이야기하기 연구에 일조할 것으로 기대한다.

좋은 반려견은 어떻게 만들어지는가? : EBS1 <세상에 나쁜 개는 없다>와 KBS2 <개는 훌륭하다>의 반려견 훈련사의 문화매개 작업을 중심으로 (How are Good Dogs Made? : Focusing on the Cultural Intermediary Work of Dog Trainers in EBS1 and KBS2 )

  • 추혜원
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권4호
    • /
    • pp.17-29
    • /
    • 2020
  • 본 논문은 한국의 반려견 문화에 변화를 가져다준 요인 중 하나로 볼 수 있는 EBS1의 <세상에 나쁜 개는 없다>와 KBS2의 <개는 훌륭하다> 프로그램들에 주목하고, 방송에 재현되는 반려견 훈련사 강형욱과 설채현의 문화매개(cultural intermediary) 작업을 고찰했다. 방송 프로그램에서 반려견 훈련사는 반려견 교육에 대한 신념과 가치를 생산하기 위해 어떠한 문화매개의 장치들(devices)을 사용하고 있는지 van Dijk(1993)의 언어적 텍스트 및 시각적 이미지 분석을 통해 함께 살펴보았다. 분석 결과, "심각한" 스토리텔링, 반려견의 몸, 그리고 보호자 재교육과 같은 세가지 장치들(devices)을 확인할 수 있었다. 반려견 훈련사는 이 프로그램에서 반려견 교육의 신념과 가치를 창출할 뿐만 아니라 직접적인 대면 상호작용 서비스를 통해 소비자에게 반려견 관련 제품과 서비스를 제공해 반려견의 문화적 생산과 소비를 매개하는 작업을 수행하고 있었다. 본 논문은 다음과 같은 측면에서 학문적으로 기여했다고 본다. 첫째, 한국의 반려견 이슈를 펫코노미라는 산업 및 경제적 차원에 머물지 않고 문화적 관점에서 접근했다는 점이다. 둘째, 반려견 훈련사를 문화매개자라는 개념 및 이론적으로 고찰했고, 해당 방송 프로그램에서의 이들이 반려견 교육의 가치를 어떻게 생산하고 있는지 분석했다. 이러한 연구 결과는 한국의 반려견 문화의 다양성을 보여주는 데 도움을 주리라 여겨진다.

Zero-Shot 기반 기계번역 품질 예측 연구 (Study on Zero-shot based Quality Estimation)

  • 어수경;박찬준;서재형;문현석;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.35-43
    • /
    • 2021
  • 최근 다언어모델(Cross-lingual language model)을 활용하여 한 번도 보지 못한 특정 언어의 하위 태스크를 수행하는 제로샷 교차언어 전이(Zero-shot cross-lingual transfer)에 대한 관심이 증가하고 있다. 본 논문은 기계번역 품질 예측(Quality Estimation, QE)을 학습하기 위한 데이터 구축적 측면에서의 한계점을 지적하고, 데이터를 구축하기 어려운 상황에서도 QE를 수행할 수 있도록 제로샷 교차언어 전이를 수행한다. QE에서 제로샷을 다룬 연구는 드물며, 본 논문에서는 교차언어모델을 활용하여 영어-독일어 QE 데이터에 대해 미세조정을 실시한 후 다른 언어쌍으로의 제로샷 전이를 진행했고 이 과정에서 다양한 다언어모델을 활용하여 비교 연구를 수행했다. 또한 다양한 자원 크기로 구성된 언어쌍에 대해 제로샷 실험을 진행하고 실험 결과에 대해 언어별 언어학적 특성 관점으로의 분석을 수행하였다. 실험결과 multilingual BART와 multillingual BERT에서 가장 높은 성능을 보였으며, 특정 언어쌍에 대해 QE 학습을 전혀 진행하지 않은 상황에서도 QE를 수행할 수 있도록 유도하였다.

품사별 출현 빈도를 활용한 코로나19 관련 한국어 가짜뉴스 탐지 (COVID-19-related Korean Fake News Detection Using Occurrence Frequencies of Parts of Speech)

  • 김지혁;안현철
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.267-283
    • /
    • 2023
  • 2019년 12월부터 현재까지 지속되고 있는 코로나19 팬데믹으로 인해 대중들은 감염병 대응을 위한 정보를 필요로 하게 되었다. 하지만 소셜미디어에서 유포되는 코로나19 관련 가짜뉴스로 인해 대중들의 건강이 심각하게 위협받고 있다. 특히 코로나19와 관련된 가짜뉴스가 유사한 내용으로 대량 유포될 경우 사실인지 거짓인지 진위를 가리기 위한 검증에 소요되는 시간이 길어지게 되어 우리 사회의 전반에 심각한 위협이 될 수 있다. 이에 학계에서는 신속하게 코로나19 관련 가짜뉴스를 탐지할 수 있는 지능형 모델에 대한 연구를 활발하게 수행해 오고 있으나, 대부분의 기존 연구에 사용된 데이터는 영문으로 구성되어 있어 한국어 가짜뉴스 탐지에 대한 연구는 매우 드문 실정이다. 이에 본 연구에서는 소셜 미디어 상에서 유포되는 한국어로 작성된 코로나19 관련 가짜뉴스 데이터를 직접 수집하고, 이를 기반으로 한 지능형 가짜뉴스 탐지 모델을 제안한다. 본 연구의 제안모델은 언어학적 특성 중 하나인 품사별 빈도 정보를 추가적으로 활용하여, 기존 연구에서 주로 사용되어 온 문서 임베딩 기법인 Doc2Vec 기반 가짜뉴스 탐지 모델의 예측 성능을 제고하고자 하였다. 실증분석 결과, 제안 모델이 비교 모델에 비해 Recall 및 F1 점수가 높아져 코로나19 관련 한국어 가짜뉴스를 보다 정확하게 판별함을 확인하였다.

온라인 커뮤니티에서 보여지는 노령화 사회의 단면: 대화 방식과 사용 언어의 변화에 대한 탐색적 연구 (A Reflection of Aging Society in Online Communities: An Exploratory Study on Changes in Conversation Style and Language Usage)

  • 이정;한진영;함주연
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.51-68
    • /
    • 2023
  • 1990년대 말 인터넷의 등장과 함께 시작된 온라인 커뮤니티의 활용기간이 사반세기를 넘어가면서, 사용자층의 평균 연령도 함께 높아지고 있다. 본 연구는 온라인 커뮤니티의 사용자 연령이 높아지면서 말투에 어떠한 변화가 일어났는지 탐색한다. 이를 위해 신규회원의 가입이 9년 전 중지되었으나 기존 회원만으로 2023년 현재까지 여전히 활발하게 운영 중인 한 온라인 커뮤니티에서 2012년부터 2022년까지 총 11년간의 게시물을 수집, 분석하였다. 그 결과, 사용자의 연령층이 높아짐에 따른 평균 댓글수의 증가, 의문문의 감소, 명령지시어의 감소 등을 확인하였다. 그리고 이러한 변화의 원인으로서 노화로 인한 외로움의 증가, 호기심과 자신감의 하락 등을 제시하였다. 세계적으로 유례없이 빠르게 고령화 사회로 진입하고 있는 대한민국에서는 이전까지는 각 개인들이 감내하던 외로움과 고독감이 1인 가구의 증가라는 사회적 현상과 더불어 고독사와 은둔형 외톨이의 증가라는 사회적 문제로 진화하고 있다. 본 연구는 이러한 대한민국 사회 변화의 한 단면을 대형 온라인 커뮤니티의 게시물 분석을 통해 보여주면서 향후 어떠한 방향으로 이러한 문제들이 논의되어야 할지 생각해본다.

프라이버시 보호를 위한 오프사이트 튜닝 기반 언어모델 미세 조정 방법론 (Privacy-Preserving Language Model Fine-Tuning Using Offsite Tuning)

  • 정진명;김남규
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.165-184
    • /
    • 2023
  • 최근 구글의 BERT, OpenAI의 GPT 등, 언어모델(Language Model)을 사용한 비정형 텍스트 데이터에 대한 딥러닝(Deep Learning) 분석이 다양한 응용에서 괄목할 성과를 나타내고 있다. 대부분의 언어모델은 사전학습 데이터로부터 범용적인 언어정보를 학습하고, 이후 미세 조정(Fine-Tuning) 과정을 통해 다운스트림 태스크(Downstream Task)에 맞추어 갱신되는 방식으로 사용되고 있다. 하지만 최근 이러한 언어모델을 사용하는 과정에서 프라이버시가 침해될 수 있다는 우려가 제기되고 있다. 즉 데이터 소유자가 언어모델의 미세 조정을 수행하기 위해 다량의 데이터를 모델 소유자에게 제공하는 과정에서 데이터의 프라이버시가 침해될 수 있으며, 반대로 모델 소유자가 모델 전체를 데이터 소유자에게 공개하면 모델의 구조 및 가중치가 공개되어 모델의 프라이버시가 침해될 수 있다는 것이다. 이러한 상황에서 프라이버시를 보호하며 언어모델의 미세 조정을 수행하기 위해 최근 오프사이트 튜닝(Offsite Tuning)의 개념이 제안되었으나, 해당 연구는 제안 방법론을 텍스트 분류 모델에 적용하는 구체적인 방안을 제시하지 못했다는 한계를 갖는다. 이에 본 연구에서는 한글 문서에 대한 다중 분류 미세 조정 수행 시, 모델과 데이터의 프라이버시를 보호하기 위해 분류기를 추가한 오프사이트 튜닝을 적용하는 구체적인 방법을 제시한다. 제안 방법론의 성능을 평가하기 위해 AIHub에서 제공하는 ICT, 전기, 전자, 기계, 그리고 의학 총 5개의 대분야로 구성된 약 20만건의 한글 데이터에 대해 실험을 수행한 결과, 제안하는 플러그인 모델이 제로 샷 모델 및 오프사이트 모델에 비해 분류 정확도 측면에서 우수한 성능을 나타냄을 확인하였다.

토픽 모델링과 머신 러닝 방법을 이용한 온라인 C2C 중고거래 시장에서의 사기 탐지 연구 (A Study on the Fraud Detection in an Online Second-hand Market by Using Topic Modeling and Machine Learning)

  • 이동우;민진영
    • 경영정보학연구
    • /
    • 제23권4호
    • /
    • pp.45-67
    • /
    • 2021
  • 온라인 C2C 중고거래에 대한 수요가 증가하고 있으나 물품을 보내지 않거나 명시한 것과 다른 물건을 보내는 방식으로 부당한 금전적 이득을 챙기려는 사기 행위자들의 수도 증가하고 있다. 본 연구는 이러한 사기를 미연에 방지하기 위한 머신 러닝 방법을 이용한 사기 탐지 모델을 구축하였다. 이를 위해 대표적 C2C 중고거래 플랫폼인 중고나라에서 145,536건의 거래 게시글을 수집하였다. 이후 이들 게시글에서 토픽 모델링 기법을 이용하여 상품 설명 내용의 주제를 추출하였으며, 상품 설명의 언어적 특성, 준언어적 특성, 상품의 특성, 게시글의 포스팅 특성, 구매자 특성, 거래 특성들을 추출하였다. 이를 XGBoost 방법에 기반한 머신 러닝 모델을 구축하여 사기 게시글을 탐지하였다. 분석 결과, 사기 게시글은 글 자체의 길이가 대체로 짧고, 제공하는 정보가 적고 상대적으로 구체적이지 않은 것으로 나타났으며 명사를 상대적으로 적게 쓰고 이미지도 사용하지 않거나 적게 사용하는 글이 대부분인 것으로 나타났다. 또한 상대적으로 숫자와 공백의 비율이 높게 나타났으며 정상 게시글의 경우 명사의 경우 상품의 정보, 동사의 경우 전달, 형용사의 경우는 행위와 관련된 단어들이 사용되었으나 사기 게시글은 뚜렷한 주제를 가지지 못하는 것으로 나타났다. 본 연구는 전화번호나 계좌번호를 사용한 기존의 방법과 달리 다양한 게시글의 특성으로 사기 여부를 탐지하는 모델을 구축했다는 점에서 학술적, 실무적 시사점을 가지고 있다.

혈액 순환 모형 기반 수업에서 고등학생들의 개념 변화 분석 (Analysis of High School Students' Conceptual Change in Model-Based Instruction for Blood Circulation)

  • 김미영;김희백
    • 한국과학교육학회지
    • /
    • 제27권5호
    • /
    • pp.379-393
    • /
    • 2007
  • 이 논문의 목적은 혈액 순환 모형 기반 수업을 적용한 후에 11학년 학생들의 개념 변화를 다차원적 틀로 분석하는 것과 개념 이해를 향상시키기 위한 교수 전략에 대한 시사점을 찾아내는 것이다. 그 모형 기반 수업은 4차시로 구성되었다: (1) 혈액 순환에 관한 과학사를 적용하여 학생들의 흥미를 유도하는 도입 부분, (2) 쥐의 해부 실험, (3)심장의 자동 박동에 관한 비디오 자료, (4) 혈액 순환의 경로 모형 구성하기 활동. 사전 검사, 사후 검사, 면담 자료에 근거하여, 학생들의 혈액 순환 경로 모형을 구분하였고, 혈액 순환 개념에 관한 학생들의 존재론적 속성과 개념 지위를 조사하였다. 대부분의 학생들은 수업 후에 혈액 순환의 경로와 그 혈액 성분의 변화를 정확히 기술하였다. 그러나 그 모형 구성하기 활동은 심장에 연결된 각 기관으로의 혈류량 분배와 혈액과 조직세포 사이의 물질 교환 기작의 이해를 향상시키는데 충분하지 못했다. 면담에서 학생들이 언급한 개념 지위 요소 분석을 통해, 학생들의 개념 이해에 어떤 개념 지위 요소가 도움을 주는지, 잘못된 개념 지위 요소는 무엇인지, 잘 사용되지 않는 지위 요소는 무엇인지 등의 정보를 얻을 수 있었다. 또한 학생들의 각 개념 지위 획득은 혈액 순환 개념에 대한 어떤 존재론적 속성을 갖는가에 따라 달라짐을 발견하였다. 이런 연구 결과는 혈액 순환과 같은 평형 범주의 개념 변화률 촉진하기 위한 교수 전략을 고안하는데 도움을 줄 수 있을 것이다.

학문 목적 한국어 학습자의 한국어 능력과 학업 적응에 관한 연구 (The narrative inquiry on Korean Language Learners' Korean proficiency and Academic adjustment in College Life)

  • 정연숙
    • 국제교류와 융합교육
    • /
    • 제4권1호
    • /
    • pp.57-83
    • /
    • 2024
  • 이 연구는 외국인 유학생들의 한국어 능력 시험(TOPIK) 등급이 학업 적응에 미치는 영향을 알아보고자 하였다. IRB의 승인을 거쳐 모집한 학생은 모두 7명으로 이들의 면담 내용은 실용적 절충주의에 기초한 포괄적 분석절차 (이동성, 김영천, 2014)의 6단계를 활용해 분석했으며 그 결과 학문 목적 한국어 학습자의 학업 적응에 영향을 미치는 요인을 학업, 생활, 심리·정서의 범주로 나눌 수 있었다. 학업적 측면에서 인터뷰 대상자들은 적응하기 힘들었던 전공 용어와 전공 공부를 지적하였고, 한자 및 한자어에 큰 어려움을 경험했다. 다음으로 생활 측면에서는 고급 수준의 토픽 등급 소지자인 연구 참여자들도 대학 생활 적응에 어려움이 있었고 한국 생활에 제대로 적응하기 위해서는 실용적인 표현과 풍부한 어휘 지식이 필요함을 토로했다. 마지막으로 심리·정서적인 범주에서는 이들이 한국인들과의 대화나 발표에 상당한 스트레스를 받고 있음을 파악할 수 있었다. 사회 문화 및 일상 생활 문화에 관한 지식도 부족했기 때문에 한국어를 잘하더라도 화용적인 면에서 실수나 오류를 범하기도 했고 이것이 심리·정서적인 어려움에 처하는 요인이 되기도 했다. 이러한 이야기들을 근거로 한국어 학습자의 학업 적응을 촉진하기 위해서는 한국어 학습의 다양한 기회 부여라는 목표를 기반으로 학습자의 전공 관련 학업 능력 강화, 한국어 숙달도 향상, 학내 관계 형성에 도움을 주어야 한다는 결론을 내렸다. 그리고 연구자는 이를 위한 해결 방안으로 외국인 학습자들을 위한 다양한 비교과 활동을 계획·설계하여 시도해 볼 것을 제안했다.

과학 모델링 활동에 나타난 교사의 담화 분석 -지구과학 교사 연수 사례- (A Discourse Analysis of Science Teachers' Scientific Modeling Activities: A Case from Earth Science Teacher Training)

  • 엄흥진;심현진
    • 한국과학교육학회지
    • /
    • 제44권4호
    • /
    • pp.301-311
    • /
    • 2024
  • 과학 모델링을 활용한 현직 교사 대상의 소집단 연수 프로그램을 개발하고, 참여한 교사들의 활동 중 담화를 유형별로 분석하였다. 연수 프로그램은 소집단이 '은하와 우주' 내용을 소재로 협동하여 산출물을 제작하는 과제 해결 방식을 따르고 있으며, 추후 교실 수업에 실제 적용이 가능하도록 구상하였다. 3명의 현직 과학 교사를 참여자로 선정하여 이들의 담화를 녹음, 전사하였고, 개별 진술과 상호작용 단위로 유형 분류를 수행하였다. 교사들의 언어 표현에는 교직 사회의 고유한 특성이 반영되었으며, 저마다의 선호하는 언어 표현 유형이 존재하는 반면 특정 언어 표현 유형의 비중은 공통적으로 낮게 나타났다. 모델링 소재와 과제 제시 방식, 사용된 모델의 유형에 따른 담화 특성 차이가 존재하는지 살펴보았을 때, 설계, 제작, 평가 단계에 해당하는 상호작용의 비율 차이는 주로 모델링 소재의 친숙도에 영향을 받는 것으로 파악되었다. 과제 제시(해결) 방식 또한 상호작용 유형에 영향을 주는 반면, 모델의 유형은 상호작용의 유형별 분포에 별 영향이 없었다. 이를 고려하면, 현직 교사를 대상으로 한 모델링 연수를 실시할 때는 충분한 상호작용이 이루어질 수 있도록 체크리스트를 제공하고, 공동 작업을 통해 답변할 수 있는 적절한 문제를 제시할 필요가 있다.