• 제목/요약/키워드: 중요어

검색결과 870건 처리시간 0.024초

Wikipedia에서 온톨로지 개념 인식을 위한 핵심어 추출 (Term Extraction for Ontology Concept Recognition in Wikipedia)

  • 고병규;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.344-347
    • /
    • 2010
  • 최근 주목받고 있는 의미적 정보처리의 지식베이스인 온톨로지는 정형화된 표현을 통해 정확한 지식 처리와 추론관계를 명시해야 하기 때문에 온톨로지 확장에 대한 중요성 역시 강조되고 있다. 온톨로지 확장을 위한 기존의 방법들은 전문가를 통한 수작업 형태이거나 보편화된 사전이나 시소러스 집단의 분석을 통한 통계의 확률분포를 이용하는 반자동화된 방법들이 있다. 이에 본 논문에서는 Wikipedia에서 특정 도메인 문서들만을 수집한 후 중요문장 추출과정을 통해 해당 문서 내의 핵심어를 파악하여 이를 온톨로지의 개념 인식을 위한 정보로 활용할 수 있는 방안을 제시하고자 한다.

워드넷 기반 협동적 평가와 하이퍼링크를 이용한 검색엔진의 성능 향상 (Improving Performance of Search Engine By Using WordNet-based Collaborative Evaluation and Hyperlink)

  • 김형일;김준태
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.369-380
    • /
    • 2004
  • 본 논문에서는 정색엔진의 성능 향상을 위하여 질의어의 모호성 해결과 새로운 가중치 부여 방식을 제안한다. 일반적인 검색엔진은 질의어의 형태와 같은 것들이 포함되어 있는 웹 페이지를 결과로 보여주는 내용기만 방식을 사용하고 있다. 검색 결과로 나타난 웹 페이지들의 순위를 결정하는데 있어서도 주어진 질의어와 웹 페이지 사이의 키워드 매칭에 의한 내용기반 방식을 사용한다. 이와 같이 질의어의 형태만으로 웹페이지들과 유사도를 비교한다는 것은 정확한 검색에 많은 장애를 준다. 또한 질의어의 의미에 모호성이 존재할 경우에는 사용자의 의도와 관련 없는 것들이 결과로 나타나기도 한다. 이러한 원인의 발생은 일반적인 검색엔진들이 내용기반 방법을 기반으로 웹 검색에 이용되기 때문이다. 본 논문에서는 질의어에 모호성이 있는 경우 워드넷을 이용하여 모호성을 해결하도록 하는 사용자 인터페이스를 구현했다. 그리고 사용자의 클릭 수를 각 웹 페이지의 가중치에 누적함으로써 다수 사용자의 협동적 평가에 따른 웹 페이지의 중요도가 검색 순위에 반영되도록 하였다. 클릭수의 누적에 있어서 질의어의 의미 카테고리별로 가중치를 구분하여 저장함으로써 보다 세분화된 웹 페이지 가중치 부여 방식을 사용하였다 그리고 점 페이지의 하이퍼링크를 웹 페이지의 가중치에 적용하였다. 웹 페이지의 가중치에 하이퍼링크를 적용함으로써 웹 페이지의 대표성을 가중치에 부여하여 가중치에 신뢰도를 증가시켰다. 실험용 정색엔진이 일반 검색엔진에 비해 높은 검색 정확도를 나타내는 것을 실험을 통해 확인하였다.

한국어 자연어 요구문서에서 구문 구조 기반의 조응어 처리 시스템 (Anaphora Resolution System for Natural Language Requirements Document in Korean based on Syntactic Structure)

  • 박기선;안동언;이용석
    • 정보처리학회논문지B
    • /
    • 제17B권3호
    • /
    • pp.255-262
    • /
    • 2010
  • 시스템 개발에 있어서 요구문서(requirements document)를 생성하고 정형 명세를 작성하는 것은 요구 분석 전문가와 명세 전문가에 의해 수행되고 있다. 만약 요구문서 생성과 정형 명세 작성 과정을 자동화 한다면 시스템 개발 비용 및 기간을 단축할 수 있고, 또한 전문가 사이의 잘못된 이해로 인한 오류를 줄일 수 있다. 대명사는 인칭대명사와 지시대명사로 분류될 수 있다. 일반적으로 요구문서의 특성상 인칭대명사는 사용되지 않기 때문에 본 논문은 지시대명사의 지시어 결정에 초점을 두고 있다. 지시대명사를 포함하는 요구문서에서 자연어처리 기법을 통해 정형화된 요구사항을 자동으로 추출하기 위해서는 대명사의 지시어 결정이 매우 중요하다. 본 연구의 최종 목표는 자연어 처리 기법을 통하여 자연어 요구문서로부터 시스템 개발에 필요한 정형 명세를 자동으로 생성하는데 있다. 이를 위해 본 논문은 선행연구를 기반으로 한국어로 기술된 자연어 요구문서에서 대명사에 대한 지시어를 결정하는 조응어 해소(anaphora resolution) 시스템을 제안한다. 본 시스템의 개발을 위해 조응어 해소를 위한 경험 규칙을 정의하고, 이를 통해 10개의 요구문서에 대해 실험한 결과 평균 재현율 92.45%, 정확률 69.68%의 성능을 보였다.

불안정 노동자를 위한 임금 체계와 사회보장 사례 연구: 호주 건설 노동자의 어워드 임금 체계를 중심으로 (A Study on Wage System and Social Security for Precarious Workers: Focusing on the Award Wage of Construction Workers in Australia)

  • 이균호;임운택
    • 산업노동연구
    • /
    • 제24권3호
    • /
    • pp.109-142
    • /
    • 2018
  • 이 논문은 대표적인 불안정 노동자 직군에 속하는 건설 노동자에 대한 호주의 어워드 임금 체계와 사회보장제도를 분석하고 한국에 대한 시사점을 도출하는 데 그 목적이 있다. 호주는 19세기 후반 격렬한 노사분쟁을 겪은 후 노사갈등을 예방, 해결하기 위한 노사정 중심의 중재위원회를 구축하고 이를 토대로 어워드라는 고유한 임금 체계 및 사회보장제도를 운용하고 있다. 어워드는 공정노동위원회라는 중재위원회에서 결정되는 임금 체계로서 전후 자본주의의 황금기에 고임금을 유지하고 경제성장을 견인해 내는데 중요한 요소로 작용했다. 신자유주의 개혁 이후 그 역할이 축소되었지만, 호주의 건설 노동자들은 여전히 높은 수준의 최저임금을 유지하고 있고 어워드 임금 체계가 직업교육훈련과 숙련 관리체계와 연계되어 있다는 점에서 시사하는 바가 크다. 신자유주의 개혁과정에서 시장경쟁을 이유로 고임금=유효수요창출이라는 전통적 케인스주의적 정책적 목표가 수정되었고 그에 대한 반발을 누그러뜨리려 의무 퇴직연금과 공공 건강보험과 같은 보편적 복지제도가 도입되었다. 한편, 건설 노동자와 같이 이동성과 불안정성이 높은 노동자들을 위해 어워드 임금 체계를 통해 장기근속 유급휴가와 퇴직급여라는 이동식 급부가 제공되고 있다. 호주의 숙련 수준이 낮은 건설 노동자의 사회보장 부담률은 우리나라의 평균 건설 노동자의 사회보장 부담률과 비슷한데 노후소득의 소득 대체율이 월등히 높다는 점에서 우리에게 주는 시사점이 있다.

해선어 양식업이 첨단산업으로 가는 길

  • 조세영
    • 한국양식학회:학술대회논문집
    • /
    • 한국양식학회 2003년도 추계학술발표대회 논문요약집
    • /
    • pp.15-16
    • /
    • 2003
  • 이제 바다로부터 식량을 얻는 방법이 어선을 통해 포획하는데서 점점 연근해에서 양식을 통해 생산하는 쪽으로 선회를 하는 것이 세계적인 추세가 되어가고 있다. 이와 같은 양식업의 점진적 발전은 해수 환경을 보전하고 생산 비용을 절감할 수 있는 새로운 형태의 먹이(사료)를 요구하고 있다. 그러나 물고기의 먹이로 적합한 어분 및 잡어의 생산과 공급은 해마다 어족 자원의 고갈로 감소되고 있다. 이런 가운데 양식어종의 사료로 어분이나 잡어를 대체할 수 있는 단백질 공급원을 개발하고 활용하는 연구가 활발히 진행되고 있다. 역사적으로 대두는 약 5000년 전 중국에서 재배되기 시작했다. 사람들은 본격적으로 19세기 초부터 대두에 대한 연구를 시작하여 대두가 사람에게 중요한 단백질과 기름을 제공할 수 있다는 것을 깨달았다. 1950년대 초반에 이르러 대두박이 값싸지만 단백질이 풍부한 사료원료로서의 가치가 입증되면서, 축산업이 오늘의 전성기를 구가할 수 있는 계기가 마련되었다. 그렇지만 바다에서 식량을 생산하는데 있어서도 육지에서 가장 많이 재배되는 두류작물인 대두와 대두제품을 활용하기 시작한 것은 먼 오래전의 일이 아니다. 우리나라뿐만 아니라 세계 여러 나라에서도 담수어종인 잉어, 뱀장어 및 틸라피아등에서 대두박의 영양학적 우수성이나 경제성이 이미 입증된 바 있다. 앞으로 해산어 양식기술의 발달은 해산어용 전문 배합사료의 개발과 보급 없이는 불가능하기 때문에, 미국, 일본, 노르웨이등 해산어 양식 선진국들일수록 이 부문에 대한 연구 개발 노력이 특히 활발하다. 식생활은 물론이고 심지어는 친환경적 산업 제품에 이르기까지 대두와 대두제품이 우리의 각광을 받고 있는 것은 결코 콩이 지닌 물리적 성상, 영양학적 및 경제적 가치의 우수성 때문만은 아니다. 미국은 자국의 대두 생산자들이 생산해 낸 대두를 판매하면서 조성한 자조금을 모아 대두의 생산성을 향상시키기 위한 연구 개발과 국내외 시장을 확대하기 위한 마케팅 활동에 쓰고 있다. 이런 자조 노력은 비단 미국의 대두 농민들에게만 국한된 것이 아니다. 가깝게는 일본의 수산업과 해산어 양식산업의 발전은 중앙 및 지방 정부, 수협과 같은 어민 조합 및 연근해 수산업 종사자들이 출연한 기금을 통해 이루어지고 있음을 지난 8월 북해도의 양식산업을 시찰했을 때 확인할 수 있었던 사실이다. 이제 우리나라도 국민소득 1만불 시대를 넘어 2만불 시대를 열기 위한 청사진을 그릴 만큼 모든 경제의 규모가 확대되었을 뿐 아니라 질적으로 고도화되었다. 우리에게 필요한 것은 성숙된 산업사회에 걸맞는 각 산업 주체들의 의식이다. 한국의 양식산업도 자조 정신을 갖추어 생산성 향상에 초점을 맞춘 양식기술의 개발, 환경 보전을 고려한 양식장 관리 및 소비를 확대하기 위한 유통시스템의 선진화에 스스로 투자를 해야 할 시기에 와 있다.

  • PDF

Atlantic Canada 해산어 Haddock, Melanogrammus aeglefinus의 자치어 발생 단계 (The Larvae and Juvenile Development of Haddock, Melanogrammus aeglefinus Cultured in Atlantic Canada)

  • 김치홍;임재현;;허준옥;박인석
    • 한국발생생물학회지:발생과생식
    • /
    • 제8권1호
    • /
    • pp.11-17
    • /
    • 2004
  • 북대서양에서 상업 적으로 중요한 해산어류인 Haddock Melanogrammus aeglefinus의 자치 어 발생과정과 성장을 조사하였다. 자치어는 부화 후 67일까지 사육실 조건에서 사육되었고 주기 적으로 표본한 재료를 실체 현미경으로 관찰하였다. 발생단계별 크기 변화는 부화 후부터 지속적인 성장을 보여 Y=4.07 $e^{0.037}$( $R^{2}$=0.9978)의 성장식을 나타내었다. 부화 직후의 자어는 전장 4.9 m로 장방형의 난황을 가지고 있었다. 초기 먹이섭취는 부화 후 7일에 시작되었으나 부화 후 16일 째 전장 6.8 m때에 난황이 완전히 흡수되어 후기 자어 단계가 되었다. 부화 후 16~52일의 기간에 부속기관의 발달이 활발히 진행되었으며, 전장 41.3 mm인 부화 후 61일에 턱수염은 완전히 발달되지는 않았지만 치아, 측선, 체측의 검은 반점 등은 성어와 같은 모습의 치어 단계에 도달하여 본 종은 이 시기 이후로 먹이와 생태적 행동변화가 일어나는 것으로 추정된다.다.

  • PDF

노가리와 명태에 대한 형태학적 고찰 (Meristic And Morphometric Observations On Nogari And Alaska Pollack)

  • 김완수;허성회
    • 한국해양학회지
    • /
    • 제13권2호
    • /
    • pp.26-30
    • /
    • 1978
  • 노가리는 명태, Theragrachalcogramma(PALLAS)의 미성어라고 오래전부터 알려져 왔으며 우리나라 수산자원보호령의 미성어 보호대책 규정에 의해 종래에는 그 어획이 금지되어 있었다. 그러나 수산당국은 자원학적 견지에서 노가리를 어획하여도 무방하다는 해석을 내려 1974년부터 노가리에 대한 어획금지규정을 폐기하였으며 현재까지 어획을 허용하고 있다. 명태는 우리나라 국민의 중요한 식량원이며 동해안에서 비교적 산업적 가치가 높은 데도 불구하고 이 집단에 대한 자원생물학적 지견과 자원의 변동법칙은 아직 잘 알려져 있지 않으며 일부 어민들은 심지어 노가리는 명태의 미성어가 아니라고 주장하고 있는 것이 현상이다. 명태는 개체 또는 집단으로서 넓은 변이성을 가진 어종이라고 알려져 있지만, 현금과 같은 격렬한 어업 압력에 과연 얼마나 견딜 수 있는가를 규명하는 일이 요청되고 있다. 본고에서는 노가리와 명태에 대해 몇가지의 형태학적 집단표징을 관찰하여 검토한 결과를 보고한다.

  • PDF

책임표시의 기술방식 개선을 위한 역할어의 활용 방안 연구 (A Study on Using the Role Indicators to Improve the Description Methods of the Statement of Responsibility)

  • 박지영
    • 정보관리학회지
    • /
    • 제28권3호
    • /
    • pp.65-82
    • /
    • 2011
  • 서지레코드의 기술에 있어서 책임표시는 저작의 지적 책임 소재를 밝혀 주고 접근점을 구성하는 바탕이 된다. 그런데 목록규칙에서는 책임표시를 주된 역할과 부차적 역할로 나누고, 이에 따라 기술방법을 달리 하는데 치중하는 문제점이 있다. 역할의 중요도를 판단하여 순서를 매기기보다는 역할 자체를 구조화시키는 것이 우선이기 때문이다. 또한 목록에서 주저자를 선정한 것은 책임성에 따른 것보다는 저록의 작성이나 배열과 관련된 실무적 결정이었다. 이에 본 연구에서는 역할 자체를 구조화함으로써 책임표시 기술방식을 개선하고자 하였다. 즉, 역할어를 체계적으로 기술하여 서지레코드에서 분산되거나 접근점에서 제외된 책임표시를 집중시키는 것이다. 나아가 이를 통해 책임표시 정보의 품질을 제고하고, 역할어를 검색의 패싯이나 전거레코드의 추가적인 식별 정보로도 활용할 수 있음을 제안하였다.

BM25 기반 고난도 부정 지식 검색을 통한 오픈 도메인 지식 기반 한국어 대화의 지식 검색 모듈 성능 향상 (Improvement of Knowledge Retriever Performance of Open-domain Knowledge-Grounded Korean Dialogue through BM25-based Hard Negative Knowledge Retrieval)

  • 문선아;김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.125-130
    • /
    • 2022
  • 최근 자연어처리 연구로 지식 기반 대화에서 대화 내용에 자유로운 주제와 다양한 지식을 포함하는 연구가 활발히 이루어지고 있다. 지식 기반 대화는 대화 내용이 주어질 때 특정 지식 정보를 포함하여 이어질 응답을 생성한다. 이때 대화에 필요한 지식이 검색 가능하여 선택에 제약이 없는 오픈 도메인(Open-domain) 지식 기반 대화가 가능하도록 한다. 오픈 도메인 지식 기반 대화의 성능 향상을 위해서는 대화에 이어지는 자연스러운 답변을 연속적으로 생성하는 응답 생성 모델의 성능 뿐만 아니라, 내용에 어울리는 응답이 생성될 수 있도록 적합한 지식을 선택하는 지식 검색 모델의 성능 향상도 매우 중요하다. 본 논문에서는 오픈 도메인 지식 기반 한국어 대화에서 지식 검색 성능을 높이기 위해 밀집 벡터 기반 검색 방식과 주제어(Keyword) 기반의 검색 방식을 함께 사용하는 것을 제안하였다. 먼저 밀집 벡터 기반의 검색 모델을 학습하고 학습된 모델로부터 고난도 부정(Hard negative) 지식 후보를 생성하고 주제어 기반 검색 방식으로 고난도 부정 지식 후보를 생성하여 각각 밀집 벡터 기반의 검색 모델을 학습하였다. 성능을 측정하기 위해 전체 지식 중에서 하나의 지식을 검색했을 때 정답 지식인 경우를 계산하였고 고난도 부정 지식 후보로 학습한 주제어 기반 검색 모델의 성능이 6.175%로 가장 높은 것을 확인하였다.

  • PDF

텍스트 요약을 위한 어텐션 기반 BART 모델 미세조정 (Fine-tuning of Attention-based BART Model for Text Summarization)

  • 안영필;박현준
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1769-1776
    • /
    • 2022
  • 긴 문장으로 이루어진 글을 자동으로 요약하는 것은 중요한 기술이다. BART 모델은 이러한 요약 문제에서 좋은 성능을 보여주고 널리 사용되고 있는 모델 중 하나이다. 일반적으로 특정 도메인의 요약 모델을 생성하기 위해서는 큰 데이터세트를 학습한 언어 모델을 그 도메인에 맞게 다시 학습하는 미세조정 작업을 수행한다. 이러한 미세조정은 일반적으로 마지막 전 연결 계층의 노드 수를 변경하는 방식으로 진행된다. 하지만 본 논문에서는 최근 다양한 모델에 적용되어 좋은 성능을 보여주고 있는 어텐션 계층을 추가하는 방법으로 미세조정하는 방법을 제안한다. 제안하는 방법의 성능을 평가하기 위해 미세조정 과정에서 층을 더 깊게 쌓기, 스킵 연결 없는 미세조정 등 다양한 실험을 진행하였다. BART 언어 모델에 스킵 연결을 가진 2개의 어텐션 계층을 추가하였을 때 가장 좋은 성능을 보였다.