• 제목/요약/키워드: 문서처리시스템

검색결과 1,387건 처리시간 0.041초

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

분산 멀티미디어 스트리밍 시스템 설계 및 구현 (Design and Implementation of a Distribute Multimedia System)

  • 김상국;신화종;김세영;신동규;신동일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.677-680
    • /
    • 2000
  • 웹이 등장하면서 지금까지 인터넷 상에서 텍스트와 이미지를 이용하여 정보를 표현하고 전달하는 방법이 가장 많이 사용되어왔다. 그러나 웹 관련 기술의 비약적인 발달과 네트워크 속도의 증가 및 인터넷의 급속한 보급으로 단순한 텍스트와 이미지 중심의 HTML 문서를 이용한 정보의 전달이 아닌 멀티미디어 데이터를 이용한 정보의 표현과 전달이 점차 증대되고 있다. 이에 따라 멀티미디어 데이터를 전송하기 위한 스트리밍 프로토콜도 등장하였다. 최근에는 컴퓨터의 성능 증가 및 네트워크 속도의 증가(초고속 통신 서비스의 보급)에 의해 멀티미디어 데이터의 전송이 가능하게됨으로써 기존의 공중파나 CATV 방송국의 형태 지니고 인터넷 상에서 실시간 생방송 서비스와 VOD(Video On Demand) 서비스를 제공하는 인터넷 방송국이 급속하게 생겨나고 있다.[11] 인터넷 방송은 동영상과 오디오의 실시간 전달을 가능하게 하는 멀티미디어 스트리밍 기술과 멀티미디어를 실시간으로 전송할 수 있는 실시간 전송 프로토콜을 기반으로 발전하고 있다. 인터넷 상에서 멀티미디어 스트리밍 서비스를 하는 대부분의 인터넷 방송은 스트리밍 서버로서 RealNetworks사의 RealSystem과 Microsoft사의 WMT(Windows Media Technologies)를 사용하고 있다. 본 논문은 Real Server와 WMT의 비교 분석을 통해 실시간 전송 프로토콜을 지원하고, 멀티미디어 스트리밍 기술을 지원하는 자바를 기반으로 한 분산 서버 구조의 스트리밍 서버, 서버간의 부하를 제어하는 미들웨어, 멀티미디어 스트림을 재생할 수 있는 클라이언트를 설계하고 구현한다. 방법에 대해서 자세히 살펴보고 실제 SQL Server 7.0 환경에서 구축된 공간 엔진 및 OLE DB 제공자 컴포넌트의 구현 예에 대하여 살펴볼 것이다. 혈액내방사선 조사량이 안전용량 범위(200rad)에 속하며 48시간 후 체내잔류량은 서양인과 큰 차이가 없었다.비출현의 소견을 보이는 악성종양 환자의 골 신티그람 53개중 44개 (83.0%)에서 척추 및 늑골에 미만성, 또는 다발성 침습이 관찰되었다. 또 골전이 부위를 두개골, 척추, 견대부, 늑골, 골반, 사지의 근위부 장골의 6개 부위로 나누어 분석할 경우 49개(92.5%)에서 3부위 이상에 전이가 발견되었고, 35개(66.0%)에서 4부위 이상에 전이가 발견되었으며, 5부위 이상, 6개 부위에 모두 전이가 발견된 것은 각각 20개 (37 7%), 11개(20.8%)이었다. 이상의 성적으로 보아 악성종양 환자의 골 신피그라피에서 신장 영상의 비출현은 종양의 광범위한 골전이를 간접적으로 시사하는 소견으로 생각된다. 여러 악성종양중 전립선암에서 신장 영상 비출현의 빈도가 가장 높았으며, 특히 위암에서 골전이 및 신장 영상 비출현의 빈도가 높음은 주목할 만한 것이라 하겠다.출한 결과 인,규소 증가와 자가영양성 미소플랑크톤(ANP)증가에 미치는 요인이 해안과 외해에서 동일하게 가장 큰 설명력을 보였다. N:P 비도 해안에서 36.4, 외해에서 32.6을 보이고 있어 인이 상당히 부족한 것으로 나타났다. 따라서 조사해역은 인이 식물플랑크톤 성장에 중요한 제한요인으로 작용하고 있다고 판단된다.의 회전. 전위력의 강도, 적용시점, 그리고 키, 체중등의 신체적 요인 등이 있으나 능숙한 기계사

  • PDF

기업간 비즈니스 프로세스 등록저장소를 위한 메타데이터 온톨로지 설계 (Metadata Ontology Design for B2B Business Process Registries)

  • 김종우;김형도;윤정희;정현철
    • 정보처리학회논문지D
    • /
    • 제14D권4호
    • /
    • pp.435-446
    • /
    • 2007
  • B2B 등록저장소는 기엽의 프로파일, 비즈니스 문서, 비즈니스 프로세스, 제공 서비스 등의 B2B 관련 비즈니스 정보들을 저장하고 거래 파트너 또는 잠재 거래 파트너들에게 정보를 제공하는 시스템이다. 본 논문에서는 이 중 B2B 비즈니스 프로세스의 등록저장소의 설계에 초점을 맞추어, 이를 지원하기 위한 메타데이터 온톨로지를 제시한다. 현재 ebXML BPSS (Business Process Specification Schema), WSBPEL (Web Service Business Process Execution Language), BPMN (Business Process Modeling Notation) 등의 다수의 비즈니스 프로세스 정의 언어들이 시장에서 경쟁하고 있다. 이러한 상황을 고려하여, 다수의 다른 프레임워크에서 표현된 비즈니스 프로세스를 등록저장하기 위해서 제시된 메타 데이터 온톨로지는 3개 계층, 공통 메타데이터, 언어별 메타데이터, 상호연관관계 메타데이터로 구성된다. 제시된 메타데이터 온톨로지의 유용성을 보이기 위해서, ebXML BPSS 와 WSBPEL로 표현된 비즈니스 프로세스의 온톨로지 내에 저장을 예제로 제시한다. 또한 제시된 메타데이터 온톨로지의 구현을 위해서 ebXML 등록저장소 정보모델로의 매핑 방안을 제시한다.

디지털 포렌식 기반의 침해 지표 포맷 개발 및 활용 방안 (Digital Forensic Indicators of Compromise Format(DFIOC) and Its Application)

  • 이민욱;윤종성;이상진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권4호
    • /
    • pp.95-102
    • /
    • 2016
  • 기밀 정보 유출, 데이터 파괴 등 디지털 기기에 저장된 정보를 위협하는 침해사고가 계속해서 증가하고 있다. 이와 함께 디지털 침해 사고를 조사하기 위하여 디지털 포렌식 기술 또한 계속해서 발전해 왔다. 디지털 포렌식 기술의 발전으로 인하여 사용자의 행위를 추적할 수 있는 다양한 포렌식 아티팩트들이 발견되었으며, 포렌식 아티팩트로부터 정보를 추출하기 위한 다양한 포렌식 도구가 개발되었다. 하지만 포렌식 도구에서 출력하는 정보는 각기 다른 양식을 갖고 있다. 따라서 포렌식 도구에서 출력하는 정보를 다시 가공해야 하는 작업이 필요하다. 가공된 데이터는 데이터 간의 정보를 비교 분석하여 연관관계를 도출하고 그 의미를 파악해야 한다. 이를 위하여 데이터를 가공하는 작업에서 데이터의 저장과 출력을 효과적으로 하기 위한 방안이 필요하다. 본 논문에서는 침해사고 조사 분석시 필요한 다양한 포렌식 아티팩트 정보를 효과적으로 기술할 수 있는 디지털 포렌식 침해지표 작성 포맷 DFIOC(Digital Forensic Indicators Of Compromise)를 제안한다. DFIOC는 XML 기반의 포맷이며 침해사고 조사에 필요한 다양한 포렌식 아티팩트 정보를 Evidence로 표현하여 기술할 수 있다. 또한 포렌식 분석 결과를 기록하는 Forensic Analysis를 제공하고 있으며, 침해 흔적을 기록하기 위하여 Indicator 항목을 제공하고 있다. 포렌식 분석 과정에 필요한 데이터를 DFIOC 포맷의 문서 하나로 기록할 수 있게 됨으로써 불필요한 데이터 가공이 발생하지 않게 된다. 또한 정규화된 포맷을 통해 수집된 정보를 기록하기 때문에 입출력이 쉬워지며 수집된 정보를 확인하고 상호 연관관계 분석에 활용하기 쉬워진다.

학교평가 정책: 한국과 스웨덴의 비교 (Education Policy of School Evaluation: A Comparative Case study in South Korea and Sweden)

  • 정지원
    • 비교교육연구
    • /
    • 제23권5호
    • /
    • pp.19-52
    • /
    • 2013
  • 이 논문은 한국과 스웨덴의 학교평가 시스템을 기술하고 학교 자체 및 외부 평가라는 두 영역에서 두 나라간 교육환경에 따른 평가정책의 양상을 상호 비교하고자 한다. '학교의 질 제고' 및 '교육 분권화'의 방향으로 세계 교육환경의 관심이 전환되면서, '교육 평가'의 중요성에 대한 인식 또한 증대되고 있다. '학교 평가'를 통해 기술되어지는 교육 기관들의 취약점을 보완하고, 이들이 가진 강점을 고양시켜 장기적 관점에서 학교 질제고에 기여할 수 있게 된다는 것이다. 연구문제는 한국과 스웨덴에서 시행되고 있는 학교평가의 양상이 두 나라의 교육환경에서 어느 정도 변용되어 시행되고 있는가 이며 연구내용은 '평가목표, 도구, 기준 및 결과 처리 방법'의 범위에서 학교자체평가를 '평가기관, 기준 및 결과처리 방법'의 영역에서 학교외부평가의 양상을 한국과 스웨덴으로 나누어 살펴보고 교육환경의 차이가 가져다준 학교평가의 유사점 및 상이점을 분석하는 것이다. 이를 위해 인터뷰 및 문서 자료 분석을 중심으로 한 질적 연구를 수행하였다. 연구결과에서는 교육 분권화가 정착단계에 있는 스웨덴과 과도기에 있는 한국의 학교평가 양상은 상당히 다른 모습을 보이고 있음을 각 범주별로 기술하고 논의하였다. 이에 교육정책의 양상은 각 나라의 교육환경과 밀접한 관련을 맺고 있으며 한국과 스웨덴 간 학교평가정책 운영의 우위를 논하기 보다는 분권화 정도에 따라 교육평가 정책이 효율적으로 운영되고 있는지를 논의하였고 앞으로 차용할 외국의 교육정책 또한 현 국가의 실태에 맞춰 변용할 필요가 있음을 언급하고 있다.

차세대염기서열분석법을 이용한 HLA-A, -B 그리고 -DR 형별 분석법 개발 (Development of HLA-A, -B and -DR Typing Method Using Next-Generation Sequencing)

  • 서동희;이정민;박미옥;이현주;문서윤;오미진;김소영;이상헌;형기은;허혜진;조대연
    • 대한수혈학회지
    • /
    • 제29권3호
    • /
    • pp.310-319
    • /
    • 2018
  • 배경: 최근 차세대염기서열분석법(Next Generation Sequencing: NGS)을 이용한 HLA 형별 분석에 대한 연구가 활발히 진행되고 있다. 이에 HLA 고해상도 분석법의 내재적 한계인 위상 모호성의 문제를 해결하고, 대량 검체 처리가 가능한 NGS 기반 고해상도 HLA 형별 검사법을, 자체 기술로 개발하고자 본 연구를 실시하였다. 방법: HLA NGS를 위한 핵산 추출 조건, 라이브러리 제작 및 PCR 체계 확립, 그리고 생물정보학을 이용한 HLA 형별 분석법을 개발하였다. 본 기관에서 개발한 NGS 기반 HLA 형별 검사의 정확성을 알아보기 위해 SSOP법으로 HLA 형별을 알고 있는 192개 검체와 SBT법으로 HLA 형별을 알고 있는 28개 검체에 대해 NGS 기반으로 검사한 HLA-A, -B 그리고 -DR 형별 결과를 비교해 보았다. 결과: 두 단계의 PCR을 통한 DNA 라이브러리 제작과 MiSeq (Illumina Inc., San Diego, USA) 기기를 이용한 NGS 시퀸싱 그리고 데이터 분석 시스템을 구축하였다. 기존에 HLA 형별을 알고 있는 220개 혈액 검체에 대해 NGS 기반 HLA 형별검사 결과가 모두 일치함을 확인하였다. 결론: NSG 기반 HLA 형별 검사법은 많은 검체를 효율적인 시간 내에 처리가 가능하여 조혈모세포기증 희망자 HLA 검사 등에 유용할 것으로 기대된다.

Organic Light-Emitting Diodes 디스플레이 기술의 특허 동향과 기술적 가치에 관한 탐색적 연구 (An Exploratory research on patent trends and technological value of Organic Light-Emitting Diodes display technology)

  • 김민구;김용우;정태현;김영민
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.135-155
    • /
    • 2022
  • 본 연구는 Organic Light-Emitting Diodes(OLEDs) 산업의 하위기술 분야를 도출하여 특허 동향을 분석하고 각 하위기술 분야별 기술 가치, 독창성, 다양성을 분석한다. 특허 자료 수집을 위해 OLED 기술과 관련된 국제 특허 분류(International Patent Classification) 집합을 정의하고, 이를 활용해 2005년부터 2017년까지 출원된 OLED 연관 특허를 수집하였다. 이어서 토픽모델을 이용하여 대량의 특허 문서를 12가지 주요 기술로 구분하고 각 기술에 대한 동향을 조사하였다. 그중 터치 센서, 모듈, 이미지 처리, 회로 구동 관련 특허는 증가 추세를 보였으나 가상 현실, 사용자 인터페이스 관련 특허는 최근 감소하였고, 박막 트랜지스터, 지문 인식, 광학필름 관련 특허는 지속적인 추세를 보였다. 이후 각 기술 그룹에 포함된 특허의 전방 인용 수, 독창성, 다양성을 조사하여 기술적 가치를 비교하였다. 결과로부터 전방 인용 수, 독창성, 다양성이 높은 이미지 처리기술, UI/UX, 모듈 기술, 점착 기술 분야가 상대적으로 높은 기술적 가치를 보여주었다. 본 연구를 통해 기업의 기술 전략 수립과정에서 활용 가치가 높은 정보를 제공한다.

거북목 자세를 예방하기 위한 목 건강 경고 알고리즘 (A neck healthy warning algorithm for identifying text neck posture prevention)

  • 이재은;김종남;최홍석;김영봉
    • 융합신호처리학회논문지
    • /
    • 제23권3호
    • /
    • pp.115-122
    • /
    • 2022
  • 몇 년 전 코로나가 발병하면서 화상 회의, 전자 문서 작업이 많아지게 되었고 이 때문에 현대인들의 하루 일과 중에서 컴퓨터 작업을 하는 비중이 증가하고 있다. 하지만 오랜 시간 동안 잘못된 자세로 컴퓨터 작업을 하는 사람들이 많아지게 되면서 시력 저하, 거북목증후군 환자들이 늘고 있다. 최근까지도 자세 교정을 위한 연구들이 많이 발표되고 있지만 대부분은 사용자가 장비를 착용하여 자세 교정을 해야 하므로 사용자가 불편함을 겪을 수 있다는 한계가 있다. 본 논문에서는 초음파 센서 장치를 이용하여 컴퓨터 모니터와 사람 사이의 최소 거리 접근을 방지하기 위한 자세 교정 센서 시스템을 제안한다. 그리고 이때 최소 거리 시 울리는 경고 알람 중 오류 알람을 최소화하는 알고리즘도 함께 제안한다. 이는 초음파 센서 장치를 이용하기 때문에 몸에 기기를 부착하지 않고도 자세 교정을 할 수 있으며 사용자의 불편함을 해소할 수 있다는 장점이 있다. 또한, 실험 결과에서 거리 측정 시 발생한 잡음을 제거하여 오류 알람을 줄임으로써 정확도를 높일 수 있음을 보였다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

SMIL을 기반으로 한 멀티미디어 네트워크 교육시스템 (Multimedia Network Teaching System based on SMIL)

  • 우뢰;조극양;방진숙;조태범;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.524-527
    • /
    • 2008
  • 최근 디지털 및 인터넷이 보편화되고, 멀티미디어 처리 기술과 정보통신 기술이 발달함에 따라 인터넷을 이용한 교육의 수요는 급격히 증가하고 있다. 또한 다양한 멀티미디어 정보를 보다 자유롭게, 시간과 공간의 제약을 받지 않으면서 이용할 수 있게 되었다. 그러나 여러 종류의 오디오, 미디어와 같은 멀티미디어 데이터를 통합하여 표현하기 위한 요구가 확산되었다. 이에 따라 1998년 W3C에서 XML(eXtensible Markup Language)에 기반을 둔 SMIL(Synchronized Multimedia Integration Language)을 제안하였다. 이러한 멀티미디어 요소가 통합된 SMIL 문서는 플레이어를 통해 네트워크 교육 학습자와 상호 작용하는 멀티미디어 콘텐츠로서 단순히 오디오만 전달하는 인터넷 라디오 방송에 다양한 멀티미디어 요소를 추가하여 보다 많은 정보를 전달하며, 이를 통해 학습자 중심의 새로운 인터넷 라디오 방송 서비스를 창출할 수 있는 가능성이 마련되었다. 이에, 본 논문에서 제안한 시스템은 교사가 쉽게 멀티미디어 정보를 만들어 수업에 활용 할 수 있도록 한다. 학생들은 교사가 수업하는 오디오, 비디오 등 정보를 동시에 시청각할 수 있다. 그리고 채팅창을 통해서 문자로 실시간 교류할 수 있다. 또한, 수업 후에 학생들은 언제나 수업의 내용을 자율적으로 요청하고 볼 수 있다.

  • PDF