• 제목/요약/키워드: 이론 기반 데이터 과학

검색결과 120건 처리시간 0.022초

대규모 언어 모델의 언어 패턴 다양화를 위한 반복적 피드백 기반 성격 페르소나 생성법 (Iterative Feedback-based Personality Persona Generation for Diversifying Linguistic Patterns in Large Language Models)

  • 황태호;송호윤;신지수;조석민;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.454-460
    • /
    • 2023
  • 대규모 언어 모델(Large Language Models, LLM)의 발전과 더불어 대량의 학습 데이터로부터 기인한 LLM의 편향성에 관심이 집중하고 있다. 최근 선행 연구들에서는 LLM이 이러한 경향성을 탈피하고 다양한 언어 패턴을 생성하게 하기 위하여 LLM에 여러가지 페르소나를 부여하는 방법을 제안하고 있다. 일부에서는 사람의 성격을 설명하는 성격 5 요인 이론(Big 5)을 이용하여 LLM에 다양한 성격 특성을 가진 페르소나를 부여하는 방법을 제안하였고, 페르소나 간의 성격의 차이가 다양한 양상의 언어 사용 패턴을 이끌어낼 수 있음을 보였다. 그러나 제한된 횟수의 입력만으로 목표하는 성격의 페르소나를 생성하려 한 기존 연구들은 세밀히 서로 다른 성격을 가진 페르소나를 생성하는 데에 한계가 있었다. 본 연구에서는 페르소나 부여 과정에서 피드백을 반복하여 제공함으로써 세세한 성격의 차이를 가진 페르소나를 생성하는 방법론을 제안한다. 본 연구의 실험과 분석을 통해, 제안하는 방법론으로 형성된 성격 페르소나가 다양한 언어 패턴을 효과적으로 만들어 낼 수 있음을 확인했다.

  • PDF

시계열 데이터베이스에서 선형 추세 제거 서브시퀀스 매칭 (Linear Detrending Subsequence Matching in Time-Series Databases)

  • 길명선;김범수;문양세;김진호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.586-590
    • /
    • 2010
  • 본 논문에서는 선형 추세 제거 서브시퀀스 매칭을 정의하고, 이를 효율적으로 수행하기 위한 인덱스 기반 해결책을 제안한다. 이를 위해, 먼저 윈도우 자체의 선형 추세가 아닌 해당 윈도우를 포함하는 서브시퀀스의 선형 추세를 제거하여 얻은 새로운 윈도우인 LD-윈도우 개념을 제시한다. 다음으로, LD-윈도우를 이용하여 제안하는 인덱스 기반 해결책의 이론적 근거인 하한 조건을 제시하고, 이를 정형적으로 증명한다. 이러한 하한 조건에 기반하여, 본 논문에서는 또한 인덱스 구성 및 서브시퀀스 매칭 알고리즘을 각각 제안한다. 마지막으로, 실험을 통해 제안하는 인덱스 기반 해결책의 우수성을 입증한다.

광물자원탐사 자료에 대한 데이터 통합과 그 응용사례 (Data Fusion of Mineral Exploration Data Sets and Its Application Using Fuzzy Set Theory)

  • Sungwon Choi
    • 자원환경지질
    • /
    • 제32권5호
    • /
    • pp.537-544
    • /
    • 1999
  • 금소광산은 지질학적 특성에 따라 여러 다양한 유형으로 형성되며, 특정원소나 특정광물종이 농집된다. 그러므로 광물자원탐사는 지질자료와 함께 많은 지구화학적 및 지구물리자료를 종합하여 분석처리 할 필요가 있다. 최근 지구과학정보시스템(GIS)이라는 개념이 도입됨에 따라, 도입됨에 따라 다양한 지질자료를 보다 체계적으로 처리할수 있게 되었고 효율적인 광물자원탐사가 가능하게 되었다. 본 연구대상지역 (37:00N/28:30E∼37:20N/128:45E0은 국내의 대표적인 광대화로 알려진 태백산 지역으로 영남육괴의 변성암을 기반으로 하여, 조선계의 퇴적암과 중생대의 화강암으로 구성되어있다. 본 연구에서는 이러한 지질자료와 함께 기보고된 지구화학 및 지구물리 탐사자료들을 디지털화하고 이를 퍼지집합이론에 적용하여 데이터통합을 시도하였다. 본 연구의 결과초써 나타난 스카른 부존가능지역이 기존의 스카론 철광산으로 알려진 신예미 광산 위치와 잘 일치하고 있으며, 이는 본 연구에서 데이터 통합에 사용된 퍼지집합이론이 태백산 지역이 스카른 광상탐사에 효과적이었음을 시사한다.

  • PDF

주문형 비디오 서버의 버퍼 최소화를 위한 가변적 서비스 모드 변환 (Adaptive Service Mode Conversion to Minimize Buffer Space Requirement in VOD Server)

  • 원유집
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권5호
    • /
    • pp.213-217
    • /
    • 2001
  • CPU, 네트웍 대역폭, 디스크 속도등 컴퓨터와 통신 기반을 이루는 기반기술의 급진적인 발달에 따라, 컴퓨터 또는 단말기로 멀티미디어 데이터 서비스를 받는 것이 이제는 우리 생활의 일부분이 되었다. 이러한 급속한 서비스 저변의 확대에도 불구하고 아직도 고화질 멀티미디어 서비스를 제공하는 데 있어서 많은 기술적인 문제가 존재하는 것이 현실이라고 할 수 있겠다. 그 중의 하나로 멀티미디어 정보를 디스크로부터 읽어들여 실시간 상영하는 경우, 과도한 주기억 장치 버퍼의 요구가 문제점으로 등장한다. 주기억 장치 버퍼가 필요한 이유는 디스크는 자료를 비동기적으로 읽는데 반해 멀티미디어 데이터(프레임)를 상영하는 방법은 동기적으로 행해지므로 두 가지 특성이 다른 작업간에 비동기성을 해결하기 위함이다. 사용자에게 스트리밍 데이터를 전송하는 방법에는 두 가지 (디스크에서 읽어들이는 방법 : 디스크 모드와 기존에 메모리에 탑재된 데이터를 재 전송하는 방법 : 메모리 모드)가 있는데, 각 방법에 따라 필요로 하는 주기억 장치 버퍼의 양이 다르다. 본 연구에서는 각 방법에 따른 주기억 장치 요구량을 계산하는 모델을 개발하고, 전체 버퍼양을 최소화하도록 자료 전송방법을 가변적으로 변환시키는 기법을 소개한다. 본 기법의 가장 큰 장점은 각 비디오 세션의 데이터 전송하는 방법이 서버의 상태에 따라서 가변적으로 변환된다는 사실이다. 본 기법은 대용량 비디오 서버에서 다수의 멀티미디어 세션을 상영하는 데 필요한 버퍼 양을 효과적으로 감소 시킬수 있으며, 특히 사용자들의 주문이 소수의 화일들에게 집중되어 있는 경우 더욱 효과적으로 작동하고 있다. 제안된 기법의 근간이 되는 이론들의 구체적인 모델링이 제공되었으며, 본 기법이 항상 최적의 해를 구한다는 사실은 증명을 통해 보여진다. 주창되는 기법의 효율성과 성능을 시뮬레이션을 통해서 검증한다.

  • PDF

인공지능 기반 사회적 지지를 위한 대형언어모형의 공감적 추론 향상: 심리치료 모형을 중심으로 (Enhancing Empathic Reasoning of Large Language Models Based on Psychotherapy Models for AI-assisted Social Support)

  • 이윤경;이인주;신민정;배서연;한소원
    • 인지과학
    • /
    • 제35권1호
    • /
    • pp.23-48
    • /
    • 2024
  • 대형언어모형(LLM)을 현실에 적용하려는 지속적인 노력에도 불구하고, 인공지능이 맥락을 이해하고 사람의 의도에 맞게 사회적 지지를 제공하는 능력은 아직 제한적이다. 본 연구에서는 LLM이 사람의 감정 상태를 추론하도록 유도하기 위해, 심리 치료 이론을 기반으로 한 공감 체인(Chain of Empathy, CoE) 프롬프트 방법을 새로 개발했다. CoE 기반 LLM은 인지-행동 치료(CBT), 변증법적 행동 치료(DBT), 인간 중심 치료(PCT) 및 현실 치료(RT)와 같은 다양한 심리 치료 방식을 참고하였으며, 각 방식의 목적에 맞게 내담자의 정신 상태를 해석하도록 설계했다. CoE 기반 추론을 유도하지 않은 조건에서는 LLM이 사회적 지지를 구하는 내담자의 글에 주로 탐색적 공감 표현(예: 개방형 질문)만을 생성했으며, 추론을 유도한 조건에서는 각 심리 치료 모형을 대표하는 정신 상태 추론 방법과 일치하는 다양한 공감 표현을 생성했다. 공감 표현 분류 과제에서 CBT 기반 CoE는 감정적 반응, 탐색, 해석 등을 가장 균형적으로 분류하였으나, DBT 및 PCT 기반 CoE는 감정적 반응 공감 표현을 더 잘 분류하였다. 추가로, 각 프롬프트 조건 별로 생성된 텍스트 데이터를 정성적으로 분석하고 정렬 정확도를 평가하였다. 본 연구의 결과는 감정 및 맥락 이해가 인간-인공지능 의사소통에 미치는 영향에 대한 함의를 제공한다. 특히 인공지능이 안전하고 공감적으로 인간과 소통하는 데 있어 추론 방식이 중요하다는 근거를 제공하며, 이러한 추론 능력을 높이는 데 심리학의 이론이 인공지능의 발전과 활용에 기여할 수 있음을 시사한다.

외부 환경을 가진 사랑 모델에서 컬러 잡음을 고려한 카오스 거동 현상 (Chaotic Behavior Phenomena in Love Model with External Environment considering Colored Noise)

  • 손영우;배영철
    • 한국전자통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.343-348
    • /
    • 2020
  • 지난 50년에 걸쳐 카오스 이론은 수학, 물리학에서 관심을 가지고 연구하기 시작하여 공학, 사회과학 분야에까지 연구가 확장되어왔다. 최근에는 자연과학과 사회과학을 융합한 융합 연구 형태로 발전하고 있다. 이러한 융합의 연구는 중독문제, 인간의 행복문제, 가족들 사이에서 발생하는 문제, 남녀 간의 사랑 문제를 포함한다. 본 논문에서는 이러한 융합 연구의 하나인 사랑 모델을 기반으로 외부 환경을 고려하고, 이 외부 환경에 컬러 잡음을 반영하였을 때, 사랑 모델에서 카오스 패턴이 어떤 영향을 받는지를 시계열 데이터와 위상공간을 통하여 검증한다.

캐쉬 간섭실패의 정적분석 및 프로그램의 수행시간 예측 (Static Analysis of Cache Interference Miss and Prediction of Program Execution Time)

  • 이건영;정유석;홍만표
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권11호
    • /
    • pp.881-889
    • /
    • 2000
  • 프로그램의 실행시간은 캐쉬메모리의 효율적 사용과 밀접한 관계가 있다. 특히 간섭 실패는 프로그램의 성능에 큰 영향을 미치지만 나타나는 형태가 불규칙적이므로 예측하기가 매우 어렵다. 본 논문에서는 직접 사상 캐쉬전략을 사용한 완전 중첩 루프 내 배열의 캐쉬 실패율(cache miss ratio)을 구하는 분석적 모델을 제시한다. 논문에서 제시한 모델을 임의의 캐쉬 위치에 각 배열이 접근한 시간을 기반으로 다음주기에서 캐쉬 실패의 발생 여부를 예측하는데, 간섭으로 발생한 캐쉬 실패 개수에 대해 기존에 제시된 모델보다 더 빠르고 정확한 예측이 가능하다. 특히, 한문장의 수행시간 예측시간은 배열의 크기와 독립적이기 때문에, 전체 프로그램의 수행시간 예측은 배열의 크기 및 문장의 반복 회수 배만큼 빠른 결과를 보여준다. 본 모델은 프로그램의 성능예측 뿐만 아니라 데이터 지역성의 최적화, 캐쉬 구성, 스케쥴링 등에서도 이용 가능하다.

  • PDF

나이브 베이시안 학습에서 정보이론 기반의 속성값 가중치 계산방법 (An Information-theoretic Approach for Value-Based Weighting in Naive Bayesian Learning)

  • 이창환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권6호
    • /
    • pp.285-291
    • /
    • 2010
  • 본 연구에서는 나이브 베이시안 학습의 환경에서 속성의 가중치를 계산하는 새로운 방식을 제안한다. 기존 방법들이 속성에 가중치를 부여하는 방식인데 반하여 본 연구에서는 한걸음 더 나아가 속성의 값에 가중치를 부여하는 새로운 방식을 연구하였다. 이러한 속성값의 가중치를 계산하기 위하여 Kullback-Leibler 함수를 이용하여 가중치를 계산하는 방식을 제안하였고 이러한 가중치들의 특성을 분석하였다. 제안된 알고리즘은 다수의 데이터를 이용하여 속성 가중치 방식과 비교하였고 대부분의 경우에 더 좋은 성능을 제공함을 알 수 있었다.

대규모 분산 가상환경 상에서 관심영역의 부하 적응적 관리 (Load-Adaptive Management of Interest Area on a Large-scaled Distributed Virtual Environment)

  • 김상욱;이태종;김성조
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권7호
    • /
    • pp.317-330
    • /
    • 2001
  • 대규모 가상환경의 핵심은 사용자 PC의 성능에 영향을 받는 확장성에 있다. 기존의 접근 방식은 대규모 환경을 지원하기 위해 멀티캐스트를 주로 사용하였다. 그러나 멀티캐스트는 현재 멀티캐스트 하드웨어가 지원할 수 있는 그룹의 수가 제한된다는 문제점이 있다. 본 논문에서는 PC 클라이언트와 인터넷과 같은 대규모 네트워크 기반의 확장성 높은 가상환경 모델을 제시한다. 멀티캐스트 네트워크와 PC 클라이언트 사이에 위치하는 관심영역 관리자(AOIM)는 멀티캐스트 그룹과 함께 다중 필터링을 수행하여 정보의 흐름을 최적화한다. 또한, 관심영역 관리자는 사용자의 관심 패턴에 따라 관심영역(AOI)으로부터 PC 클라이언트로의 데이터 전송량을 조절한다. 관심영역은 정보의 정확도에 따라 세 단계로 구분되며, 각 단계의 구분은 네트워크 현황에 따라 적응적으로 수축 또는 확장될 수 있어 PC 클라이언트는 최적화된 가상환경 상태정보를 제공받는다. 결론적으로, 제안된 모델은 다양한 컴퓨팅 환경의 PC 클라이언트에게 정확한 최우선 관심영역 정보를 제공한다.

  • PDF

하이퍼미디어.멀티미디어.하이퍼텍스트: 정의(定義)와 개관(槪觀) (Hypermedia, Multimedia and Hypertext: Definitions and Overview)

  • 김지희
    • 정보관리연구
    • /
    • 제25권1호
    • /
    • pp.24-46
    • /
    • 1994
  • 본 논문은 하이퍼미디어, 멀티미디어, 하이퍼텍스트의 정의(定義)와 개관(槪觀)에 관한 것이다. 하이퍼텍스트에서는 관련 정보가 노드의 형태로 분류되며, 각 노드는 링크로 서로 연결된다. 하이퍼텍스트의 경우, 노드는 텍스트 혹은 그래픽 정보를 소장하고 있다. 멀티미디어에서는 여러 유형의 미디어(음성, 애니메이션, 텍스트, 그래픽, 비디오)가 결합된다. 하이퍼미디어는 하이퍼텍스트와 멀티미디어의 확장으로 볼 수 있다. 하이퍼미디어에서는 시스템에서 정보를 조직(組織)함에 있어서 노드와 링크를 사용하는 하이퍼텍스트의 개념(槪念)에 기초하고 있으며, 이런 경우 노드는 위의 멀티미디어 정의에서 언급된 여러 데이터 유형(類型)으로 구성된다. '노드와 링크' 개념은 하이퍼미디어 시스템에서 정보(情報)를 조직(組織)하는데 사용된다. 하이퍼미디어 시스템 계발의 새로운 접근방법은 지식기반(知識基盤) 접근(接近)이다. Joel Peing-Ling Loo는 지식기반 접근이 이러한 종류의 기술을 다루는 데 가장 효과적(效果的)이라고 제안하였다. 의미기반(意味基盤) 하이퍼미디어 모형(模型)이 정보책임, 유지와 검색을 표현하는데 있어서의 제한점(制限點)에 대한 해결책으로서 개발되었다. 정보의 지식기반(知識基盤) 표현은 전통적인 데이터 구조의 사용을 포함한다. 이러한 데이터 구조는 전문가(專門家) 시스템에서 사용되는 프레임(객체(客體)), 슬롯, 계승이론을 사용한다. 이러한 객체들이 데이터베이스에 포함되기 때문에 관계가 여러 객체 사이에서 개발되었으며, 또한 관계는 프레임이 속하는 어트리뷰트에 의하여 프레임 사이에서 존재(存在)할 수 있다.

  • PDF