• Title/Summary/Keyword: 생성

Search Result 41,910, Processing Time 0.054 seconds

Korean Surface Realizer Based on Topic-Comment Structure (토픽-코멘트 구조에 기반한 한국어 표층 생성기)

  • Kim, Jung-Eun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.503-508
    • /
    • 2001
  • 본 논문은 자연언어생성 기술을 이용하여 질병에 대한 기술문을 생성해 내는 시스템에서 사용되는 표층 생성기에 대해서 다루고 있다. 표층 생성기는 문장의 추상적인 표현으로부터 통사적으로, 형태론적으로 올바른 텍스트로 생성하여 내는 것을 목표로 한다. 질병에 관한 기술문에 있는 문장들은 두가지 특징을 가지고 있다. 첫번째로, 질병 기술문의 문장들은 토픽-코멘트 구조로 나타내어질 수 있다. 두번째로, 같은 의미 범주에 속하는 문장들은 같은 토픽을 가진다. 따라서, 토픽은 의미범주로부터 유추될 수 있으므로 표층 생성기의 입력인 구 명세 (phrase specification)에 표현될 필요가 없다. 본 논문에서는 이런 특징을 이용하여 효율적인 표층 생성기를 만들기 위하여 표층 생성의 단계를 내부 표현 생성과 외부 문장 생성의 두 단계로 나누었다. 내부 표현 생성 단계에서는 코멘트에 해당하는 부분을 생성하고 외부 문장 생성 단계에서 의미범주 태그에 따라 토픽을 첨가하여 최종 문장으로 생성하였다. 이런 방법으로 실험한 결과, 본 표층 생성기는 문법에 맞으면서 자연스러운 텍스트를 생성해 낸다는 것을 알 수 있었다.

  • PDF

A Study on the Target Code Generation Rule Description from Bytecode (Bytecode로부터 목적 기계 코드 생성 규칙 기술에 관한 연구)

  • Ko, Kwang-Man
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04b
    • /
    • pp.1033-1036
    • /
    • 2001
  • 컴파일러 후단부 개발시 중간 코드로부터 목적기계 코드를 생성하기 위해서는 각각의 중간 코드 명령어를 목적기계 코드로 치환하는 방법과 다양한 중간 코드 패턴에 대한 목적기계 코드 생성 규칙을 기술하는 방법으로 구분된다. 특히, 컴파일러 후단부 전체를 재구성하지 않고 중간 코드로부터 목적기계 코드를 생성하는 정형화된 규칙을 이용하면 다양한 목적기계 코드를 효율적으로 생성할 수 있다. 본 논문은 Bytecode로부터 정형화된 코드 생성 규칙을 이용하여 Pentium기계에 대한 코드 생성이 가능하도록 코드 생성 규칙 기술 모델을 제시하며 실질적으로 목적기계 코드 생성시에 참조 가능한 정보를 생성하는 코드-생성기 생성기를 연구한다 본 연구를 통해서 Bytecode로부더 다양한 목적기계 코드를 생성할 수 있는 정형화된 코드 생성 규칙 기술 방법을 얻을 수 있다.

  • PDF

Reduce Redundant Repetition Using Decoding History for Sequence-to-Sequence Summarization (단어 생성 이력을 이용한 시퀀스-투-시퀀스 요약의 어휘 반복 문제 해결)

  • Ryu, Jae-Hyun;Noh, Yunseok;Choi, Su Jeong;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.120-125
    • /
    • 2018
  • 문서 요약 문제는 최근 심층 신경망을 활용하여 활발히 연구되고 있는 문제 중 하나이다. 많은 기존 연구들이 주로 시퀀스-투-시퀀스 모델을 활용하여 요약을 수행하고 있으나, 아직 양질의 요약을 생성하기에는 많은 문제점이 있다. 시퀀스-투-시퀀스 모델을 활용한 요약에서 가장 빈번히 나타나는 문제 중 하나는 요약문의 생성과정에서 단어나 구, 문장이 불필요하게 반복적으로 생성되는 것이다. 이를 해결하기 위해 다양한 연구가 이루어지고 있으며, 이들 대부분은 요약문의 생성 과정에서 정확한 정보를 주기 위해 모델에 여러 모듈을 추가하였다. 하지만 기존 연구들은 생성 단어가 정답 단어로 나올 확률을 최대화 하도록 학습되기 때문에, 생성하지 말아야 하는 단어에 대한 학습이 부족하여 반복 생성 문제를 해결하는 것에는 한계가 있다. 따라서 본 논문에서는 기존 요약 모델의 복잡도를 높이지 않고, 단어 생성 이력을 직접적으로 이용하여 반복 생성을 제어하는 모델을 제안한다. 제안한 모델은 학습할 때 생성 단계에서 이전에 생성한 단어가 이후에 다시 생성될 확률을 최소화하여 실제 모델이 생성한 단어가 반복 생성될 확률을 직접적으로 제어한다. 한국어 데이터를 이용하여 제안한 방법을 통해 요약문을 생성한 결과, 비교모델보다 단어 반복이 크게 줄어들어 양질의 요약을 생성하는 것을 확인할 수 있었다.

  • PDF

Design of an Integrated XML Data Generator for the Performance Evaluation of XML DBMSs (XML 데이터베이스 시스템 성능 평가를 위한 통합 XML 데이터 생성기의 설계)

  • Shin, Sun Mi;Jeong, Hoe Jin;Lee, Sang Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.7-10
    • /
    • 2004
  • XML 데이터베이스 시스템이 개발되면 다른 XML 데이터베이스 시스템과의 성능 비교, 또는 자체 기능에 대한 성능 평가를 수행한다. 성능 평가를 수행하기 위해서는 해당 성능 평가에 적합한 XML 데이터를 생성하는 XML 데이터 생성기가 필요하다. 본 논문에서는 지금까지 개발되었던 다양한 XML 데이터 생성기들의 특징 및 장단점을 살펴보고, 이를 기반으로 하나의 사용자 인터페이스를 이용하여 XML 데이터를 생성하는 통합 XML 데이터 생성기의 설계 내용을 기술한다. 통합 XML 데이터 생성기는 레코드 단위의 텍스트 데이터 파일의 내용을 기반으로 XML 데이터를 생성한다. 통합 XML 데이터 생성기는 관계형 데이터베이스 시스템의 데이터를 이용하여 XML 데이터로 생성하는 등 사용자가 제공하는 데이터 활용이 가능하며, 타 XML 데이터 생성기에 비해 다양한 XML 데이터를 생성함으로써 광범위한 XML 데이터베이스 시스템 성능 평가에 이용될 수 있다.

  • PDF

Research for DEM and ortho-image generated from high resolution satellite images. (고해상도 영상 자료로부터 추출한 DEM 및 정사영상 생성에 관한 연구)

  • Jeong, Jae-Hoon;Lee, Tae-Yoon;Kim, Tae-Jung;Park, Wan-Yong
    • Proceedings of the KSRS Conference
    • /
    • 2008.03a
    • /
    • pp.80-85
    • /
    • 2008
  • 최근 도심지역이 급변하고 고해상도 위성영상의 보급이 증가함에 따라 고해상도 위성영상을 이용한 수치표고모델과 정사영상 생성에 관한 연구가 활발해 지고 있다. 본 연구에서는 IKONOS, SPOT5, QUICKBIRD, KOMPSAT2 위성영상을 이용하여 DEM 과 정사영상을 생성하였으며 USGS DTED 와 기준점을 이용하여 결과의 정확도를 비교 분석하였다. 보다 정확한 DEM 생성을 위해 자동 피라미드 알고리즘을 적용하고 영상 정합시 에피폴라 기하학을 적용하였다. 정사 영상 생성시 DTED 높이값을 이용하여 보정을 수행하였으며 생성 속도를 높이기 위하여 리샘플링 그리드를 적용하였다. 본 연구에서 DEM 과 정사영상 생성시 QUICKBIRD 와 SPOT5 의 경우 영상의 용량이 매우 커 메모리 부족문제와 알고리즘 수행 속도 저하가 발생함을 확인하였다. 이를 개선하기 위하여 DEM 생성시 정합 후보점의 개수를 줄이는 알고리즘을 고안하여 기존에 메모리 문제로 생성하지 못했던 QUICKBIRD와 SPOT5 의 DEM 을 생성하였으며 정사 영상 생성시 리샘플링 그리드를 적용하여 고해상도 정상영상 생성 속도 개선에 상당한 효과를 가져왔다. 그러나 고해상도 위성 영상의 용량이 점점 커져감에 따라 이러한 메모리 문제와 처리 속도 저하에 관한 문제는 추후 계속적으로 연구되어야 할 부분이라고 할 수 있다. 본 연구에서 생성한 IKONOS, SPOT5, QUICKBIRD DEM 의 정확도를 USGS DTED 와 비교한 결과 13${\sim}$15 m 정도의 RMS 높이 오차가 산출되었으며 생성된 IKONOS, QUICKBIRD, KOMPSAT2 정사영상을 기준점과 비교한 결과 3 m 정도의 거리오차가 산출되었음을 확인하였다.

  • PDF

Pellet Geometric Effects on a Thermoelectric Generator with a High Power Electronic Component (고파워 전자소자에 부착된 열전생성기에 대한 pellet의 기학학적 구조가 미치는 영향)

  • Kim, K.J.
    • Journal of Power System Engineering
    • /
    • v.16 no.2
    • /
    • pp.36-42
    • /
    • 2012
  • 본 논문은 고파워 전자소자로부터 에너지를 수확하는 열전생성기의 성능에 pellet의 기학학적 구조가 미치는 영향들을 보고한다. 열경계저항을 포함하는 열전모델을 적용하여, 다양한 경계조건들과 열원의 열율들에 대해 pellet의 높이, pellet의 단면적, thermocouple의 수를 최적화 하고, 이처럼 최적화된 pellet의 기하학적 구조를 갖는 열전생성기의 성능과 일반적인 pellet으로 구성된 열전생성기의 전력생성성능과 효율이 예측되고 비교되어진다. 예측된 결과는 최적화된 pellet으로 구성된 열전생성기가 일반적인 pellet으로 구성된 열전생성기보다 2-10배까지 생성효율이 우수함을 보여준다. 최적화된 pellet으로 구성된 열전생성기와 일반적인 pellet으로 구성된 열전생성기의 열적성능도 예측되고 비교된다.

Generation Algorithm of Frequent Itemsets using Matrix (매트릭스를 이용한 빈발 항목집합 생성 알고리즘)

  • 채덕진;황부현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.10-12
    • /
    • 2003
  • 대용량의 데이터베이스에서 최소지지도를 만족하는 항목들의 집합을 빈발 항목집합이라고 한다. 이전에 연구된 대부분의 빈발 항목집합 생성 알고리즘들은 후보 항목집합들을 생성하고 이들 중에서 조건을 만족하는 빈발 항목집합들을 생성하는 과정을 수행하였다. 그러나 이러한 알고리즘들은 모든 k(k$\geq$1)-빈발 항목집합들을 생성하기까지 k를 하나씩 증가하면서 반복적으로 수행되기 때문에 많은 컴퓨팅 시간을 필요로 한다. 본 논문에서는 후보 항목집합들을 생성하지 않고 빈발 항목집합들을 생성할 수 있는 DFG 알고리즘을 제안한다. 각각의 k-빈발 항목집합들에는 데이터베이스의 모든 정보들이 포함되어 있고 하나의 빈발 항목집합은 한 트랜잭션에 존재한다. 본 논문에서는 이러한 성질을 이용하여 먼저 2-빈발 항목집합들을 생성한다. 그리고 2-빈발 항목집합들에 존재하는 한 항목과 나머지 항목들에 대한 매트릭스를 구성하여 최소지지도를 만족하는 빈발 항목집합들을 생성하게 된다. 제안하는 알고리즘은 불필요한 후보 항목집합들을 생성하지 않고 한 번의 데이터베이스 스캔만으로 빈발 항목집합들을 생성할 수 있다.

  • PDF

Automata-based Context Generation Model for the Determination of Indoor/Outdoor for Low-Power Consumption (저전력 소모를 위한 오토마타 기반의 실내/외 판단 컨텍스트 생성 모델)

  • Choi, Yong-hun;Choi, Ki-yong;Lee, Jung-won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.482-485
    • /
    • 2013
  • 스마트폰에서 컨텍스트 생성에 관한 연구들과 저전력에 관한 연구들이 진행 중이지만 컨텍스트 생성시에 사용되는 전력 소비 때문에 어플리케이션 개발 시에 컨텍스트를 이용하기가 어렵다. 컨텍스트를 생성하는 연구에서는 컨텍스트 생성 시에 필요한 전력에 대한 연구와 필요 이상의 전력 소비 발생에 관해서는 언급한 바가 적고 진행되어온 저전력 연구는 대부분 디스플레이와 AP 프로세서에 치우쳐 있어 저전력 컨텍스트 생성에 적용하기 힘들다. 그렇기 때문에 컨텍스트 생성 시에 필요한 전력에 대한 측정과 컨텍스트 생성 시에 불필요한 전력 낭비가 일어나는지, 그리고 컨텍스트 생성 시 과다한 전력 소비가 일어났을 경우 효율성에 대해서 생각할 필요성이 있다. 따라서 본 논문에서는 컨텍스트 생성시에 전력 소비가 얼마나 일어나는지 측정하고, 컨텍스트 생성에 있어 불필요한 전력 소비가 일어나는지 측정한다. 이를 토대로 불필요한 전력 소비가 일어나는 부분에 적용할 저전력 기법을 제안한다.

Shopping Mall Review Generator usin KoGPT2 (KoGPT2를 이용한 쇼핑몰 리뷰 생성기)

  • Park, Gyu-Hyeon;Kwon, Hee-Yun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.31-33
    • /
    • 2022
  • 쇼핑몰 리뷰 생성기는 사용자로 하여금 사용자를 대신해서 리뷰를 생성할 수 있는 기술이고, 옷 상태, 배송 상태, 사이즈와 관련된 세 가지의 카테고리를 이용하여 부분마다 점수를 부여하여 점수에 맞는 리뷰를 생성할 수 있도록 하는 기술이다. 해당 리뷰 생성기는 점수마다 생성되는 리뷰가 달라지기 때문에 다양한 리뷰 생성을 원하는 웹, 앱 쇼핑몰 사이트에서 적용이 가능한 기술이다. 본 논문에서는 KoGPT2를 이용한 리뷰 생성과 카테고리와 점수에 따른 다르게 생성되는 리뷰의 방식을 제안한다. 그리고 두 방식을 결합한 리뷰 생성의 방식을 제안한다. 제안하는 방식들은 카테고리고리 마다 학습하는 모델을 다르게 적용하고 있다.

  • PDF

상수를 염소소독시 생성되는 염소 소독부산물(DBPs)의 생성능에 관한 연구

  • Jeong, Yong;Shin, Dong-Cheon;Lim, Young-Uk;Kim, Jun-Seong;Park, Yeon-Sin
    • Proceedings of the Korea Society of Environmental Toocicology Conference
    • /
    • 1996.12a
    • /
    • pp.75-75
    • /
    • 1996
  • 최근 가장 관심이 집중되고 있는 음용수중의 미량오염물질로는 인위적으로 첨가되는 소독제(disi octant)로 인한 소독부산물(disinfection by-products: DBPs)을 들 수 있다. 1970년대부터 염소소독시 수중의 유기오염물길과 반응하여 발암성물질 과 돌연변이 물질이 다수 함유되어 있는 클로로포름(chloform)을 포함한 트리할로메탄(Trih리omethane: THMs)의 생성이 발견되었으며 이로 인한 건강상의 영향이 지속적으로 보고되고 있다. 염소소독시 780가지 이상의 화합물이 염소와 휴믹산(humic acids)과의 반응에 의해 생성되며, 이중 대부분이 할로겐 화합물로 알려져 있다. 염소 소독부산물로는 인체발암력을 지니고 있는 트리할로메탄(THMs) 이외에도 할로아세틱산(Haloaceticacids: HAAs), 할로아세토나이트릴(Haloacetbnitriles: HANs)등이 주 생성물질인 것으로 알려져 있으나 우러나라의 원수특성에 따른 소독부산물의 생성능 (Formation potential)에 대한 연구가 미흡한 실정이다. 본 연구에서는 우리나라 주요 4대강(한강, 대청호, 영산강, 낙동강)의 원수를 실험실내에서 염소처리하여 생성되는 소독부산물의 생성농과 pH, 체류시간 등의 조건에 따라 생성능을 조사하였다. 각 화합물은 추출 및 농축과정을 거친 후 GC/MSD를 사용하여 물질을 확인한 후 할로겐화합물에 민감한 GC/ECD를 사용하여 시료를 분석하였다. pH와 시간, 원수중의 유기물 함량이 소독부산물의 생성에 많은 영향을 미치는 것으로 나타났다. THMs은 알칼리에서, HAAs의 경우는 약산성에서 접촉시간이 증가할수록 높은 생성능을 보였고, HANs의 경우는 급속히 생성했다가 시간이 경과함에 따라 소멸하며 약산성에서 높은 생성능을 보임을 알 수 있었다, 강별로는 낙동강에서 THMs파 HANs의 생성능이 비교적 높았고, 영산강에서는 HAAs의 생성능이 높았다. 각 원수의 특성에 따른 생성능을 파악함으로써 생성능 저감방안을 마련하며, 소독 부산물질의 인체노출평가에 따른 위해성평가를 통해 관리기준을 설정해야 할 것이다.

  • PDF