• 제목/요약/키워드: Baseline processing

검색결과 255건 처리시간 0.023초

언어모델을 활용한 콘텐츠 메타 데이터 기반 유사 콘텐츠 추천 모델 (Similar Contents Recommendation Model Based On Contents Meta Data Using Language Model)

  • 김동환
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.27-40
    • /
    • 2023
  • 스마트 기기의 보급률 증가와 더불어 코로나의 영향으로 스마트 기기를 통한 미디어 콘텐츠의 소비가 크게 늘어나고 있다. 이러한 추세와 더불어 OTT 플랫폼을 통한 미디어 콘텐츠의 시청과 콘텐츠의 양이 늘어나고 있어서 해당 플랫폼에서의 콘텐츠 추천이 중요해지고 있다. 콘텐츠 기반 추천 관련 기존 연구들은 콘텐츠의 특징을 가리키는 메타 데이터를 활용하는 경우가 대부분이었고 콘텐츠 자체의 내용적인 메타 데이터를 활용하는 경우는 부족한 상황이다. 이에 따라 본 논문은 콘텐츠의 내용적인 부분을 설명하는 제목과 시놉시스를 포함한 다양한 텍스트 데이터를 바탕으로 유사한 콘텐츠를 추천하고자 하였다. 텍스트 데이터를 학습하기 위한 모델은 한국어 언어모델 중에 성능이 우수한 KLUE-RoBERTa-large를 활용하였다. 학습 데이터는 콘텐츠 제목, 시놉시스, 복합 장르, 감독, 배우, 해시 태그 정보를 포함하는 2만여건의 콘텐츠 메타 데이터를 사용하였으며 정형 데이터로 구분되어 있는 여러 텍스트 피처를 입력하기 위해 해당 피처를 가리키는 스페셜 토큰으로 텍스트 피처들을 이어붙여서 언어모델에 입력하였다. 콘텐츠들 간에 3자 비교를 하는 방식과 테스트셋 레이블링에 다중 검수를 적용하여 모델의 유사도 분류 능력을 점검하는 테스트셋의 상대성과 객관성을 도모하였다. 콘텐츠 메타 텍스트 데이터에 대한 임베딩을 파인튜닝 학습하기 위해 장르 분류와 해시태그 분류 예측 태스크로 실험하였다. 결과적으로 해시태그 분류 모델이 유사도 테스트셋 기준으로 90%이상의 정확도를 보였고 기본 언어모델 대비 9% 이상 향상되었다. 해시태그 분류 학습을 통해 언어모델의 유사 콘텐츠 분류 능력이 향상됨을 알 수 있었고 콘텐츠 기반 필터링을 위한 언어모델의 활용 가치를 보여주었다.

다중 어댑터를 이용한 교차 언어 및 스타일 기반의 제목 생성 (Cross-Lingual Style-Based Title Generation Using Multiple Adapters)

  • 박요한;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.341-354
    • /
    • 2023
  • 문서의 제목은 문서의 내용을 가장 효율적으로 요약하여 제공해 준다. 이때 독자들이 선호하는 스타일과 언어에 따라 문서의 제목을 다르게 제공해 준다면, 독자들은 문서의 내용을 좀 더 쉽게 예측할 수 있다. 본 연구에서는 문서가 주어졌을 때 언어와 스타일에 따라 제목을 자동 생성하는'교차 언어 및 스타일 기반의 제목 생성 모델을 제안한다. 모델을 학습하기 위해서는 같은 내용을 다른 언어와 다른 스타일로 작성한 병렬데이터가 필요하다. 그러나 이러한 종류의 병렬데이터는 구축하기 매우 어렵다. 반면, 단일 언어와 단일 스타일로 구축된 제목 생성 데이터는 많으므로 본 연구에서는 제로샷(zero-shot) 학습으로 제목 생성을 수행하고자 한다. 교차 언어 및 스타일 기반의 제목 생성을 학습하기 위해 다중 언어로 사전 학습된 트랜스포머 모델에 각 언어, 스타일, 기계번역을 위한 어댑터를 추가하였다. 기계 번역용 병렬데이터를 이용하여 기계번역을 먼저 학습한 후, 동일 스타일의 제목 생성을 학습하였다. 이때, 필요한 어댑터만을 학습하고 다른 부분의 파라미터는 모두 고정시킨다. 교차 언어 및 스타일 기반의 제목을 생성할 때에는 목적 언어와 목적 스타일에 해당하는 어댑터만을 활성화시킨다. 실험 결과로는 각 모델을 따로 학습시켜 파이프라인으로 연결시킨 베이스라인에 비해 본 연구에서 제안한 제로샷 제목 생성의 성능이 크게 떨어지지 않았다. 최근 대규모 언어 모델의 등장으로 인한 자연어 생성에서의 많은 변화가 있다. 그러나 제한된 자원과 제한된 데이터만을 이용하여 자연어 생성의 성능을 개선하는 연구는 계속되어야 하며, 그런 점에서 본 연구의 의의를 모색한다.

Feasibility of Emotional Freedom Techniques in Patients with Posttraumatic Stress Disorder: a pilot study

  • Yujin Choi;Yunna Kim;Do-Hyung Kwon;Sunyoung Choi;Young-Eun Choi;Eun Kyoung Ahn;Seung-Hun Cho;Hyungjun Kim
    • 대한약침학회지
    • /
    • 제27권1호
    • /
    • pp.27-37
    • /
    • 2024
  • Objectives: Posttraumatic stress disorder (PTSD) is a prevalent mental health condition, and techniques using sensory stimulation in processing traumatic memories have gained attention. The Emotional Freedom Techniques (EFT) is a psychotherapy that combines tapping on acupoints with exposure to cognitive reframing. This pilot study aimed to assess the feasibility of EFT as a treatment for PTSD by answering the following research questions: 1) What is the compliance and completion rate of patients with PTSD with regard to EFT protocol? Is the dropout rate reasonable? 2) Is the effect size of EFT protocol for PTSD sufficient to justify a future trial? Methods: Thirty participants diagnosed with PTSD were recruited. They received weekly EFT sessions for five weeks, in which they repeated a statement acknowledging the problem and accepting themselves while tapping the SI3 acupoint on the side of their hand. PTSD symptoms were evaluated using the PTSD Checklist for DSM-5 (PCL-5) before and after the intervention. Results: Of the 30 PTSD patients (mean age: 34.1 ± 9.1, 80% female), 96.7% showed over 80% compliance to the EFT sessions, and 86.7% completed the entire study process. The mean PCL-5 total score decreased significantly after the intervention, with a large effect size (change from baseline: -14.33 [95% CI: -19.79, -8.86], p < 0.0001, d = 1.06). Conclusion: The study suggests that EFT is a feasible treatment for PTSD, with high session compliance and low dropout rates. The effect size observed in this study supports the need for a larger trial in the future to further investigate EFT as a treatment for PTSD. However, the lack of a control group and the use of a self-rated questionnaire for PTSD symptoms are limitations of this study. The findings of this pilot study can be used to plan a future trial.

치아 임플란트 재료에 따른 자기공명영상의 SNR 비교 (Comparison of the SNR in the MR images on dental implant material)

  • 김동현;고성진;예수영
    • 융합신호처리학회논문지
    • /
    • 제16권4호
    • /
    • pp.149-155
    • /
    • 2015
  • 치아 임플란트는 구강 내에 위치하여 목, 뇌 기저부와 안면부 MR 영상에 영향을 미친다. MR 검사에 사용되어지는 자장의 비균일성은 주로 주파수 부호화 방향으로 신호강도의 변화 및 기하학적인 왜곡으로 인공물을 발생시킨다. 본 연구는 치아 임플란트에 의한 왜곡 정도를 자기공명영상의 신호대 잡음비(singal to noise ratio:SNR)를 평가하여 임플란트 영향 정도를 확인하고자 하였다. 이를 위하여 인체와 유사하게 지방, 근육, 물로 구성된 돼지고기 팬텀을 이용하여 신호대 잡음비를 측정하고, 실험을 위해 제작한 고정형 물 팬텀을 이용하여 신호대 잡음비를 측정하여 치아 임플란트 재료 종류에 따른 신호대 잡음비의 크기를 비교 분석하였다. 돼지고기 팬텀의 Brushite, HSA, Metal, RBM 은 T1 SE에서 2.76, 2.22, 1.88, 1.57 이었고, T2 FLAIR에서 1.88, 1.78, 1.65, 1.79, T2 FSE에서 2.28, 2.25, 2.88, 2.05 T2 GRE에서 2.74, 1.94, 1.67, 1.48의 신호대 잡음비가 측정되었다. 고정형 물 팬텀의 Brushite, HSA, Metal, RBM 은 T1 SE에서 1.93, 1.87, 1.93, 2.06, T2 FLAIR에서 1.83, 1.76, 1.82, 1.92 T2 FSE에서 1.85, 1.79, 7.86, 1.97 T2 GRE는 1.97, 1.93, 1.99, 2.06의 신호대 잡음비가 측정되었다. 이러한 결과를 고려해 볼 때, 치아 임플란트의 재료를 선택할 경우 환자와 치과 의사는 치아의 수복이 주된 목적이지만 여러 분야의 검사에 미치는 영향도 고려해야한다. 또한 환자의 치아 임플란트 재료에 따라 검사 프로토콜을 선택하는데 이 연구 결과가 기초자료로 활용될 수 있다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.