• 제목/요약/키워드: Semantic consistency

검색결과 62건 처리시간 0.038초

PC-SAN: Pretraining-Based Contextual Self-Attention Model for Topic Essay Generation

  • Lin, Fuqiang;Ma, Xingkong;Chen, Yaofeng;Zhou, Jiajun;Liu, Bo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권8호
    • /
    • pp.3168-3186
    • /
    • 2020
  • Automatic topic essay generation (TEG) is a controllable text generation task that aims to generate informative, diverse, and topic-consistent essays based on multiple topics. To make the generated essays of high quality, a reasonable method should consider both diversity and topic-consistency. Another essential issue is the intrinsic link of the topics, which contributes to making the essays closely surround the semantics of provided topics. However, it remains challenging for TEG to fill the semantic gap between source topic words and target output, and a more powerful model is needed to capture the semantics of given topics. To this end, we propose a pretraining-based contextual self-attention (PC-SAN) model that is built upon the seq2seq framework. For the encoder of our model, we employ a dynamic weight sum of layers from BERT to fully utilize the semantics of topics, which is of great help to fill the gap and improve the quality of the generated essays. In the decoding phase, we also transform the target-side contextual history information into the query layers to alleviate the lack of context in typical self-attention networks (SANs). Experimental results on large-scale paragraph-level Chinese corpora verify that our model is capable of generating diverse, topic-consistent text and essentially makes improvements as compare to strong baselines. Furthermore, extensive analysis validates the effectiveness of contextual embeddings from BERT and contextual history information in SANs.

개화기 조선 체류 서양인 기록물의 디지털 아카이브 시스템 구축 (Construction of the Digital Archive System from the Records of Westerners Who Stayed in Korea during the Enlightenment Period of Chosun)

  • 정희선;김희순;송현숙;이명희
    • 한국비블리아학회지
    • /
    • 제27권4호
    • /
    • pp.229-249
    • /
    • 2016
  • 본 연구는 개화기 조선 체류 서양인 기록물의 디지털 아카이브를 구축하여 지역문화콘텐츠로 활용하기 위하여 수행되었다. 서양인 기록물 22권을 대상으로 선정하여 10개의 대주제, 40개의 중주제, 239개의 소주제로 된 분류체계를 구성하고 38개 메타데이터 항목을 추출하였다. 텍스트 내용의 분석과 입력자료 유형을 분류하여 엑셀로 된 데이터베이스를 구축하고, 다양한 접근점에 의한 검색과 정보 제공을 위하여 웹기반의 디지털 아카이브 시스템을 개발하였다. 추후연구를 위하여 서양인 기록물 자료의 지속적인 발굴을 통한 아카이브 내용의 양적 확대방안, 개별 아카이브 시스템을 연계한 디지털 한국학 아카이브의 통합정보시스템 구축, 문화유산분야 분류체계 표준화와 패싯구조를 고려한 다차원적인 분류체계 개발, 메타데이터 포맷의 표준화를 통한 콘텐츠의 일관성 유지, 의미검색 기능과 데이터마이닝 기능을 활용한 온톨로지 구축을 제안하였다.

의료정보의 의미적 상호운용성 보장을 위한 임상콘텐츠 모델 (Clinical Contents Model to Ensure Semantic Interoperability of Clinical Information)

  • 안선주;김윤;윤지현;류상희;조경희;김성우;김승수;곽미숙;유승종;고영택;최덕주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.871-881
    • /
    • 2010
  • 이 기종 시스템 간 의료정보의 의미적 상호운용성 보장을 위해서는 임상정보모델의 개발과 적용이 필요하다. 하지만 국내에서는 현재까지 임상정보모델이 개발되지 않았다. 본 연구의 목적은 의료정보의 의미적 상호운용성 보장을 위한 표준용어기반의 임상정보모델인 임상콘텐츠모텔을 개발하고, 이를 한국보건의료표준용어체계와 맵핑하는 것이다. 선진 임상정보모델과 HL7 참조정보모델과 표준용어시스템 등 의료정보표준을 분석하고, 이를 바탕으로 임상의사와 의무기록사가 임상콘텐츠모델을 개발하였다. 이 모형은 차세대 전자건강기록의 의미적 상호운용성을 보장하는 핵심 인프라로 활용 될 것으로 기대한다.

다중 스케일 영상을 이용한 GAN 기반 영상 간 변환 기법 (GAN-based Image-to-image Translation using Multi-scale Images)

  • 정소영;정민교
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.767-776
    • /
    • 2020
  • GcGAN은 기하학적 일관성을 유지하며 영상 간 스타일을 변환하는 딥러닝 모델이다. 그러나 GcGAN은 회전이나 반전(flip) 등의 한정적인 기하 변환으로 영상의 형태를 보존하기 때문에 영상의 세밀한 형태 정보를 제대로 유지하지 못하는 단점을 가지고 있다. 그래서 본 연구에서는 이런 단점을 개선한 새로운 영상 간 변환 기법인 MSGcGAN(Multi-Scale GcGAN)을 제안한다. MSGcGAN은 GcGAN을 확장한 모델로서, 다중 스케일의 영상을 동시에 학습하여 스케일 불변 특징을 추출함으로써, 영상의 의미적 왜곡을 줄이고 세밀한 정보를 유지하는 방향으로 영상 간 스타일 변환을 수행한다. 실험 결과에 의하면 MSGcGAN은 GcGAN보다 정량적 정성적 측면에서 모두 우수하였고, 영상의 전체적인 형태 정보를 잘 유지하면서 스타일을 자연스럽게 변환함을 확인할 수 있었다.

지식정보 거버넌스를 위한 메타데이터 레지스트리 통합 프레임워크 (Metadata Registry Integration Framework for Knowledge Information Governance)

  • 최오훈;임정은;박성공;나홍석;백두권
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권4호
    • /
    • pp.509-519
    • /
    • 2007
  • 지식정보 거버넌스를 위하여 국가적으로 교육학술, 과학기술, 문화 분야 등에 대한 지식정보의 통합 검색이 요구되고 있다. 그러나 분야별 지식정보는 데이터 및 서비스 특성에 따라 기관별 고유 메타데이터 형식을 개발 사용해왔다. 따라서 분산된 지식정보를 메타데이터 기반으로 통합 시, 분야별 메타데이터 이질성 문제가 발생한다. 즉, 통합 검색을 위하여, 각 전문 분야별 메타데이터의 일관성 유지가 필요하다. 본 논문에서는 분야별 메타데이터를 조사하여 각 메타데이터들을 대표할 수 있는 표준 메타데이터를 정의한다. 이를 바탕으로 기존 시스템의 메타데이터의 수정 없이 기 구축된 전문 분야별 지식정보의 통합 검색을 가능하게 하는 지식정보 거버넌스를 위한 메타데이터 레지스트리 통합 프레임워크를 제안한다. 제안된 프레임워크를 통해 기존 메타데이터의 효율적인 등록 및 관리가 가능하며, 각 메타데이터간의 의미적 연관관계를 통한 의미 확장 검색이 가능하다.

  • PDF

Deep learning-based post-disaster building inspection with channel-wise attention and semi-supervised learning

  • Wen Tang;Tarutal Ghosh Mondal;Rih-Teng Wu;Abhishek Subedi;Mohammad R. Jahanshahi
    • Smart Structures and Systems
    • /
    • 제31권4호
    • /
    • pp.365-381
    • /
    • 2023
  • The existing vision-based techniques for inspection and condition assessment of civil infrastructure are mostly manual and consequently time-consuming, expensive, subjective, and risky. As a viable alternative, researchers in the past resorted to deep learning-based autonomous damage detection algorithms for expedited post-disaster reconnaissance of structures. Although a number of automatic damage detection algorithms have been proposed, the scarcity of labeled training data remains a major concern. To address this issue, this study proposed a semi-supervised learning (SSL) framework based on consistency regularization and cross-supervision. Image data from post-earthquake reconnaissance, that contains cracks, spalling, and exposed rebars are used to evaluate the proposed solution. Experiments are carried out under different data partition protocols, and it is shown that the proposed SSL method can make use of unlabeled images to enhance the segmentation performance when limited amount of ground truth labels are provided. This study also proposes DeepLab-AASPP and modified versions of U-Net++ based on channel-wise attention mechanism to better segment the components and damage areas from images of reinforced concrete buildings. The channel-wise attention mechanism can effectively improve the performance of the network by dynamically scaling the feature maps so that the networks can focus on more informative feature maps in the concatenation layer. The proposed DeepLab-AASPP achieves the best performance on component segmentation and damage state segmentation tasks with mIoU scores of 0.9850 and 0.7032, respectively. For crack, spalling, and rebar segmentation tasks, modified U-Net++ obtains the best performance with Igou scores (excluding the background pixels) of 0.5449, 0.9375, and 0.5018, respectively. The proposed architectures win the second place in IC-SHM2021 competition in all five tasks of Project 2.

확장형 규칙 표식 언어(eXtensible Rule Markup Language) : 설계 원리 및 응용 (eXtensible Rule Markup Language (XRML): Design Principles and Application)

  • 이재규;손미애;강주영
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.141-157
    • /
    • 2002
  • XML(eXtensible Markup Language, XML)은 인터넷에서의 자료 교환을 위해 고안된 언어이다. 본 논문에서는 XML의 개념을 발전시킨 확장형 규칙 표식 언어(eXtensible Rule Markup Language, XRML)를 제안하고 있다. XRML은 웹 페이지에 내재된 암묵적 규칙의 식별, 구조적인 규칙으로의 변환, 사람과 소프트웨어 에이전트간의 지식 공유를 가능하게 하며, 이를 통해 지식기반시스템(Knowledge Based System)과 지식관리시스템(Knowledge Management System)의 통합을 실현할 수 있는 새로운 언어가 될 것이다. 본고에서는 XRML이 이상과 같은 능력을 갖기 위해 반드시 갖춰야 할 6가지 설계 기준과, 이들 기준을 반영한 XRML 구성 요소로서 RIML(Rule Identification Markup Language), RSML(Rule Structure Markup Language)과 RTML(Rule Triggering Markup Language)을 설계하였으며, 개별 요소들의 기능 및 특성과 함께 태그와 DTD(Document Type Definition)도 식별하였다. 나아가 전술한 구조를 기반으로 하여 XRML을 워크플로우 시스템상의 폼처리에 적용한 Form/XRML이라는 프로토타입 시스템을 설계하고 구현하였다. 본 프로토타입의 개발을 통해, 지식기반시스템의 지식을 활용하는 RTML이 폼을 비롯한 다양한 응용시스템에 내재될 수 있으며, 웹 페이지의 암묵적 규칙과 지식기반시스템의 규칙이 일관성 있게 유지될 수 있음을 보여 주었다. 요컨대 본 연구는 XRML이 지능형 웹으로 발전하기 위한 새로운 도구이며, KBS와 KMS의 통합을 위한 중요한 도구임을 입증하였다는 점에서 큰 의의를 갖는다고 하겠다.

  • PDF

웹 페이지의 내재 규칙 습득 과정에서 규칙식별 역할에 대한 효과 분석 (Effect of Rule Identification in Acquiring Rules from Web Pages)

  • 강주영;이재규;박상언
    • 지능정보연구
    • /
    • 제11권1호
    • /
    • pp.123-151
    • /
    • 2005
  • 오늘날 자원의 보고라 할 수 있는 웹에는 자연어로 표현된 텍스트와 테이블들로 구성된 무수히 많은 문서들이 존재하고 있다. 이러한 웹 문서들로부터 규칙을 습득하고 습득된 규칙과 웹 문서간의 일관성을 유지하기 위해, 본 논문에서는 확장형 규칙 표식 언어 (extensible Rule Markup Language, XRML) 체계를 개발하였다. XRML은 웹 페이지에 내재되어 있는 규칙을 식별하여 자동으로 정형화된 규칙을 생성할 수 있도록 지원하는 규칙 식별 표식 언어 (Rule Identification Markup Language, XRML)와 구조화된 규칙 표현을 위한 규칙 구조 표식 언어 (Rule Structure Markup Language)로 구성된다. 특히, RIML은 HTML안에 내재되어 있는 규칙을 HTML 문서에 직접 명시할 수 있도록 설계되었기 때문에, RIML을 통해 웹페이지에 있는 규칙들을 식별하고 이 식별된 규칙은 RSML으로 표현된 정형화된 규칙으로 자동 변환될 수 있다. 본 논문에서는 RIML의 설계 시 웹페이지로부터 규칙을 식별하는 과정에서 발생하는 공유되는 변수 (variables) 및 값 (values),생략된 어구 ,동의어와 같은 몇 가지 중요한 현상들을 발견하고 이를 해결하고자 하였다. 제안된 XRML 접근 방법의 성능을 측정하고자, 3개의 대표적인 온라인 서점인 Amazon.com, BarnesandNoble.com, Powells.com의 실제 웹페이지들로부터 배송 및 환불과 관련된 규칙을 습득하여 XRML의 효과를 측정하는 실험을 수행하였다. 실험 결과에 따르면, 웹페이지로부터 규칙은 $97.7\%$의 매우 높은 정확성을 가지고 습득되었으며, 생성된 규칙의 완전성은 $88.5\%$로 측정되어, XRML이 특정 주제에 관한 전문가 시스템을 구축하기 위해 웹페이지로부터 규칙을 추출할 때 효율적인 도구가 될 수 있음이 예시되었다.

  • PDF

동영상에서 그룹핑(grouping) 단서로 작용하는 움직임(Movement)과 의미구조 형성의 관계 (The relation between Movement working as a Grouping clue in Moving Picture and Semantic structure forming)

  • 이수진
    • 디자인학연구
    • /
    • 제19권5호
    • /
    • pp.119-128
    • /
    • 2006
  • 미디어의 발전과 함께 시각표현은 정지화면에서 동영상으로 그 영역이 확대되었다. 애니메이션 영화, TV CM, GUI 등과 같은 분야는 프레임이 누적된 가현운동 현상이 나타나면서 쇼트, 씬과 같은 단위 구조가 만들어지므로 정지화면에 비해 움직임이 필연적인 조형요소가 된다. 따라서 형태, 색채, 공간, 크기, 움직임과 같은 조형요소 중에서 움직임은 특히 중요한 요소로 부각된다고 볼 수 있다. 소쉬르(Saussure)가 설명한 기표와 기의의 관계처럼 이미지의 표현과 형식은 그 내용과 서로 제약을 주는 반면 상호 보완에 의해 하나의 기호로서 수용된다. 이는 움직임 역시 그 형식적 특성이 메시지가 담고 있는 내용에 어떠한 관여를 할 것이라는 추론을 가능하게 한다. 이를 분석하기 전 먼저 게슈탈트이론 중 '그룹핑의 원리'를 이론적 근거로 하여 동영상 시지각 실험을 실시하여 움직임과 타 조형요소의 관계를 조사하였다. 그 결과 약 70-80%의 피실험자가 '움직임'을 지각 상 중요한 그룹핑 단서로 생각하는 것으로 나타났다. 이러한 형식적 특성을 토대로 동영상의 구조를 분석했을 때 움직임은 커뮤니케이션 과정에서 메시지의 의미의 맥락을 유지하는데 영향을 준다. 사람이나 사물, 배경의 형태와 색 등이 변하더라도 움직임이 유사한 지향점을 가지면 그 대상의 정체성은 유지될 수 있다. 둘째, 움직임에 의해 형상(figure)으로서 대상이 부각되므로 내용의 명료성을 높여준다. 셋째 추후 정보처리에 있어서 유사한 움직임의 진행을 예측할 수 있는 지식표상으로 작용하게 된다. 넷째, 교차편집과 같이 둘 이상의 씬이 빠르게 전환되고 복잡한 편집구조를 가지더라도 움직임이 내용에 일관성을 부여하는 성격을 갖는다. 움직임은 기본적인 시지각적 반응으로서 입력되는 시각정보를 그룹화시키는 하나의 단서가 된다. 또한 영상 메시지의 구조적인 틀을 형성하는데 관계하여 자칫 현란하고 남용될 수 있는 시각적 표현에 질서를 부여하고 의미 작용에 명료함을 높이는 효율성을 가진다. 동영상은 본질적으로 시간성을 내포하므로 다수의 단위 구조가 조합된 담화를 가지며, 미디어믹스 환경에 의해 공통적이면서도 차별화된 표현이 요구되고 있다. 따라서 본 연구는 게슈탈트 이론의 그룹핑 원리를 동영상 범주로 확대하여 적용해 봄으로써 움직임이 다른 조형요소보다 부각되는 속성이 됨과 의미구조 형성에 영향을 줌을 분석하였으며, 이는 미디어 특성에 따라 각 영상분야에서 구조적 조형미와 새로운 영상표현을 개발하는 관점이 될 수 있음을 제안한다.

  • PDF

담양소쇄원(潭陽瀟灑園)과 소주창랑정(蘇州滄浪亭)의 조영사상과 경관구성요소에 관한 의미(意味) 비교연구 (A Semantic Comparative Study of Formative Idea and Landscape Elements Composition of Damyang 'Soswaewon(潭陽瀟灑園)' & Suzhou 'Canglang Pavilion(蘇州滄浪亭)')

  • 위첨첨;김재식;김정문
    • 한국전통조경학회지
    • /
    • 제35권1호
    • /
    • pp.36-47
    • /
    • 2017
  • 신흥유학 성리학을 바탕으로 조영된 조선시대 별서원림인 소쇄원과 중국 송대 성리학 생성기(生成期)에 조영된 창랑정을 비교 고찰하여 원림문화의 조영사상과 구성요소의 의미론적 해석에 관한 결과를 요약하면 다음과 같다. 첫째, 소쇄원은 한국 별서원림 중에서도 성리학사상을 오롯이 구현하였으며, 중국 창랑정은 현재까지 잘 보존된 가장 연원이 깊은 중국의 사가원림으로서, 조영 시기는 소쇄원보다 약 500년가량 앞서며 조영자인 소순흠 또한 송대의 사대부로서 창랑정 조영배경에는 성리학이라는 뿌리 깊은 사상이 자리 잡고 있다. 둘째, 소쇄원과 창랑정 두 원림 모두 은일사상(隱逸思想)에 뿌리든 둔 자연친화(自然親和)성향이 두드러진다. 특히 소쇄원은 산림에 입지한 형태로 은일(隱逸) 중에서도 '소은(小隱)'이며 창랑정은 도시에 입지한 '중은(中隱)'으로 해석할 수 있다. 셋째, 소쇄원과 창랑정의 명명(命名)에 상징의미가 배태된 원림요소들을 비교분석하면, 소쇄원은 자연합일(自然合一)된 원림으로서 유불선(儒佛仙)의 다양한 사상들이 습합되어 발전된 중국 송대 성리학 사상이 원림조영에 깊숙이 내재되어 있으며, 현재 창랑정에서 발견할 수 있는 다양한 상징요소들의 의미해석의 밑바탕으로 작용하고 있다. 넷째, 사상적인 변화는 반드시 원림의 형식적 양식이나 요소들에 체현(體現)됨으로 원림요소를 비교분석하였다. 이를 통해 소쇄원은 최대한 자연을 활용함으로써 최소한의 인공을 가미하여 조영된 원림임을 알 수 있다. 즉 자연환경과 인문환경을 결합함으로써 공간의 의미적인 특징을 표출하고자 하였다. 그 대표적인 예로 소쇄원의 대봉대는 조영자의 이상을 표현하는 장소이며, 창랑정은 높은 담장 내에는 원내의 경치가 새롭게 창출되고 속세와의 단절감을 둔 채 재현된 자연을 구축함으로써, 창랑정은 가산 위에서 주변의 가경을 관조하며 삶을 성찰하는 공간으로서의 장소성이 감지된다. 한국과 중국은 같은 문화적 뿌리를 가졌음에도 불구하고 원림의 양식이나 성격에서는 다양한 차이를 드러내고 있다. 이는 사회적, 문화적 배경이 각 민족의 특성과 결합하여 원림을 형성하였고, 상이한 결과를 나타나는 것으로 해석할 수 있다.