• 제목/요약/키워드: Seed Word

검색결과 30건 처리시간 0.022초

플라즈마 기술의 농식품 분야 활용 (Status of Plasma Technology Applied to Agriculture and Foods)

  • 유석재
    • 진공이야기
    • /
    • 제2권4호
    • /
    • pp.4-8
    • /
    • 2015
  • Recently, plasma technology has been increasingly applied to agriculture and foods. Owing to the three important plasma characteristics which are activation, sterilization, and catalysis, the plasma technology can be properly applied to agriculture, in the other word, to the whole cycle of agriculture from farm to table: seed germination, plant growth, harvest and storage, washing, packaging, transport, in store, household, cooking, garbage, etc. Some representative case studies for plasma activation, sterilization, and catalysis show well that plasma technology can be successfully applied to the whole cycle of agriculture.

Rice Gruel in Chinese Food and Culture

  • Fan, Zhihong
    • 동아시아식생활학회:학술대회논문집
    • /
    • 동아시아식생활학회 2003년도 춘계학술대회: 동아시아의 주식문화
    • /
    • pp.55-60
    • /
    • 2003
  • Rice is one of the most important cereal in China. The seed of rice unearthed from ancient tombs proved that rice cultural has a history of more than 7,000 years in south China. The word "rice" was found engraved on turtle-bone scriptures of 1,500 BC. tn many ancient Chinese scriptures, rice is among the most important "Five Cereals", which includes millet, wheat, soy bean, rice and sorghum.(중략)

  • PDF

효율적인 특허정보 조사를 위한 분류 모형 (A Novel Classification Model for Efficient Patent Information Research)

  • 김영호;박상성;장동식
    • 디지털산업정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.103-110
    • /
    • 2019
  • A patent contains detailed information of the developed technology and is published to the public. Thus, patents can be used to overcome the limitations of traditional technology trend research and prediction techniques. Recently, due to the advantages of patented analytical methodology, IP R&D is carried out worldwide. The patent is big data and has a huge amount, various domains, and structured and unstructured data characteristics. For this reason, there are many difficulties in collecting and researching patent information. Patent research generally writes the Search formula to collect patent documents from DB. The collected patent documents contain some noise patents that are irrelevant to the purpose of analysis, so they are removed. However, eliminating noise patents is a manual task of reading and classifying technology, which is time consuming and expensive. In this study, we propose a model that automatically classifies The Noise patent for efficient patent information research. The proposed method performs Patent Embedding using Word2Vec and generates Noise seed label. In addition, noise patent classification is performed using the Random forest. The experimental data is published and registered with the USPTO among the patents related to Ocean Surveillance & Tracking Network technology. As a result of experimenting with the proposed model, it showed 73% accuracy with the label actually given by experts.

중간언어와 단어정렬을 통한 이중언어 사전의 자동 추출에 대한 성능 개선 (Performance Improvement of Bilingual Lexicon Extraction via Pivot Language and Word Alignment Tool)

  • 권홍석;서형원;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.27-32
    • /
    • 2013
  • 본 논문은 잘 알려지지 않은 언어 쌍에 대해서 병렬말뭉치(parallel corpus)로부터 자동으로 이중언어 사전을 추출하는 방법을 제안하였다. 이 방법은 중간언어(pivot language)를 매개로 하고 문맥 벡터를 생성하기 위해 공개된 단어 정렬 도구인 Anymalign을 사용하였다. 그 결과로 초기사전(seed dictionary)을 사용한 문맥벡터의 번역 과정이 필요 없으며 통계적 방법의 약점인 낮은 빈도수를 가지는 어휘에 대한 번역 정확도를 높였다. 또한 문맥벡터의 요소 값으로 특정 임계값 이상을 가지는 양방향 번역 확률 정보를 사용하여 상위 5위 이내의 번역 정확도를 크게 높였다. 본 논문은 두 개의 서로 다른 언어 쌍 한국어-스페인어 그리고 한국어-프랑스어 양방향에 대해서 각각 이중언어 사전을 추출하는 실험을 하였다. 높은 빈도수를 가지는 어휘에 대한 번역 정확도는 이전 연구에서 보인 실험 결과에 비해 최소 3.41% 최대 67.91%의 성능 향상을 보였고 낮은 빈도수를 가지는 어휘에 대한 번역 정확도는 최소 5.06%, 최대 990%의 성능 향상을 보였다.

  • PDF

문서 확장을 이용한 표제어 검색시스템 (Headword Finding System Using Document Expansion)

  • 김재훈;김형철
    • 정보관리연구
    • /
    • 제42권4호
    • /
    • pp.137-154
    • /
    • 2011
  • 표제어 검색시스템은 뜻풀이를 질의로 간주하는 정보검색 시스템이다. 이러한 시스템을 구축하기 위한 가장 간단한 방법으로 사전의 표제어 뜻풀이(사전 뜻풀이)를 문서로 간주하는 정보검색 시스템을 구축하는 것이다. 이 문서의 길이가 너무 짧아 사용자 질의(사용자 뜻풀이)에 대한 적절한 표제어를 검색하기 어렵다. 이 문제를 완화하기 위해서 본 논문에서는 정보검색에서 사용되는 질의 확장 개념을 문서 확장에 적용한다. 본 논문에서는 문서 확장 방법으로는 뜻풀이 확장과 유의어 확장을 사용한다. 뜻풀이 확장은 주어진 단어의 사전 뜻풀이에 속하는 단어의 뜻풀이를 문서에 포함시키는 방법이고, 유의어 확장은 무자질 군집화 알고리즘을 통해서 유의어를 찾고, 찾아진 유의어를 문서에 포함시키는 방법이다. 제안된 표제어 검색시스템은 사전 뜻풀이 그 자체를 입력으로 할 때, 16-포함률이 거의 100%에 달하였다. 또한 사용자 뜻풀이를 입력으로 할 때, 20-포함률이 66.9%였다. 사용자 뜻풀이가 단어의 의미를 충분히 전달할 수 없는 것으로 관찰되었으며 앞으로 정확하고 객관적인 평가를 위해서 평가 집합에 대한 연구가 추가적으로 필요한 실정이다.

부트스트래핑 기반의 단어-임베딩 투영 학습에 의한 대역어 사전 구축 (Bootstrapping-based Bilingual Lexicon Induction by Learning Projection of Word Embedding)

  • 이종서;왕지현;이승진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.462-467
    • /
    • 2020
  • 대역사전의 구축은 저자원 언어쌍 간의 기계번역의 품질을 높이는데 있어 중요하다. 대역사전 구축을 위해 기존에 제시된 방법론 중 단어 임베딩을 기반으로 하는 방법론 대부분이 영어-프랑스어와 같이 형태적 및 구문적으로 유사한 언어쌍 사이에서는 높은 성능을 보이지만, 영어-중국어와 같이 유사하지 않은 언어쌍에 대해서는 그렇지 못하다는 사실이 널리 알려져 있다. 본 논문에서는 단어 임베딩을 기반으로 부트스트래핑을 통해 대역사전을 구축하는 방법론을 제안한다. 제안하는 방법론은 소량의 seed 사전으로부터 시작해 반복적인 과정을 통해 대역사전을 자동으로 구축하게 된다. 이후, 본 논문의 방법론을 이용해 한국어-영어 언어쌍에 대한 실험을 진행하고, 기존에 대역사전 구축 용도로 많이 활용되고 있는 도구인 Moses에 사용된 방법론과 F1-Score 성능을 비교한다. 실험 결과, F1-Score가 약 42%p 증가함을 확인할 수 있었으며, 초기에 입력해준 seed 사전 대비 7배 크기의 대역사전을 구축하였다.

  • PDF

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

전달 계층의 보안 암호화 알고리즘 개선 (Improvement of Security Cryptography Algorithm in Transport Layer)

  • 최승권;김송영;신동화;이병록;조용환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.107-111
    • /
    • 2005
  • 본 논문에서는 MSSL에서 사용되는 전달 계층에서의 암호화 알고리즘을 개선하였는데 보다 높은 효율성을 보장하기위해 기존의 SEED 알고리즘에서 G-함수를 개선한 ISEED (Improved SEED) 알고리즘을 제안하였다. 이를 위해 라운드키 생성과정에서 가장 많은 시간이 소요되는 라운드키 값을 계산할 때 라운드 함수의 구현에서 사용된 모듈만으로 서브키를 생성할 수 있도록 알고리즘을 구현하였다. 또한 키생성 알고리즘에서 암 복호화 과정에서 필요로 하는 암호키를 서브키의 형태로 변환하는 과정에서 ISEED 알고리즘에서는 이 변환 알고리즘을 분석하고 서브키 간의 규칙성을 이용, 차분분석에 필요한 평문의 개수를 최소화함으로써 암 복호화에 소요되는 시간을 줄였다. ISEED를 기존의 알고리즘과 라운드키 생성 시간, 라운드 증가에 따른 키 생성시간과 암호화 및 복호화의 평균 수행속도를 측정하여 비교 분석하여 개선되었음을 증명하였다.

  • PDF

상품평의 언어적 분석을 통한 상품 평가 요약 시스템 (Product Evaluation Summarization Through Linguistic Analysis of Product Reviews)

  • 이우철;이현아;이공주
    • 정보처리학회논문지B
    • /
    • 제17B권1호
    • /
    • pp.93-98
    • /
    • 2010
  • 본 논문에서는 폭발적으로 증가하고 있는 상품평을 효과적으로 활용하기 위해 언어적 분석을 통하여 상품 평가를 요약하는 시스템을 제안한다. 시스템에서는 스커트 상품 분류의 경우 '디자인'과 '재질'과 같이, 상품을 평가하는 기준이 되는 항목에 대한 상품평의 부정과 긍정의 극성 여부를 판별하여 그래프 형태로 요약하여 제시한다. 본 논문에서는 작은 시드 어휘와 문맥에 기반한 자동 확장 방법을 사용하여 평가 항목 별 평가 어휘 극성 사전을 구축하여 평가 항목에 대한 상품평의 극성을 판정한다. 제안한 방식은 여러 온라인 쇼핑몰의 실제 상품평에 대한 실험에서 극성 사전 추출에서 평균 69.8%의 정확율과 문장별 극성 식별에서 평균 81.8%의 정확율을 보였다.

"내경(內經)"과 "의학입문(醫學入門)", "동의보감(東醫寶鑑)" 에 나타난 식이(食餌)의 오미(五味) 비교 (The Comparison between the Tastes of Food in "Naekyeong(內經)" and them in "Euhakibmun(醫學入門)", "Dongeuibogam(東醫寶鑑)")

  • 조학준
    • 대한한의학원전학회지
    • /
    • 제23권6호
    • /
    • pp.27-44
    • /
    • 2010
  • In order to setup the diet guideline of five grains, five meats, five fruits, and five vegetables for the diseases of five organs, I reviewed the their tastes by comparing "Naekyeong" with "Euhakibmun", "Dongeuibogam". 'Ma(麻)' in "Naekyeong" means not a hemp, a ramie or a jute, but a sesame(胡麻;참깨). 'Maik(麥)' in it means both a barley(大麥;보리) and a wheat(小麥;밀). 'Guak(藿)' in it means bean leaves(콩잎), leaves of a red-bean(팥잎) or brown seaweed(海藻;미역). 'Gyu(葵)' in "Euhakibmun Jangbujobun(臟腑條分)" is a miswritten word for 'Welsh onion' caused by similarity of shape of word. Food of a salty taste according to five elemental arrangement in "Naekyeong" is really salty according to "Euhakibmun" and "Dongeuibogam". But a barley(大麥) and a wheat(小麥) of sour taste are bitter, a chicken of sour taste or hot taste is sweet, nonglutinous millet of sour taste is sweet, an apricot of bitter taste is hot, a sesame seed of sweet taste is sour, a nonglutinous rice of hot taste is sweet, and a horsemeat of hot taste is bitter according to them. There are two ways to recommend the food for diseases of five organs. One way is to promote or control the Qi(氣) of five organs according to "Somun(素問)" and "Euhakibmun Jangbujobun", the other way is to build up the Yin(陰血) of five organs according to "Yungchu(靈樞) five tastes(五味)". The two different ways are not contradictory to each other, but complement on the view point of their substances(體) or actions(用).