• 제목/요약/키워드: 사용되어진 형식

검색결과 2,531건 처리시간 0.026초

형식형태소가 한국어 단어 벡터 생성에 미치는 영향 (Grammatical morphemes' effect on Korean word vector generation)

  • 윤준영;김도원;민태홍;이재성
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.179-183
    • /
    • 2017
  • 단어 벡터는 단어 사이의 관계를 벡터 연산으로 가능하게 할 뿐 아니라, 상위의 신경망 프로그램의 사전학습 데이터로 많이 활용되고 있다. 한국어 어절은 생산적인 조사나 어미 때문에 효율적인 단어 벡터 생성이 어려워 대개 실질형태소만을 사용하여 한국어 단어 벡터를 생성한다. 본 논문에서는 실질형태소와 형식형태소를 모두 사용하되, 형식형태소를 적절하게 분류하여 단어 벡터의 성능을 높이는 방법을 제안한다. 자체 구축한 단어 관계 테스트 집합으로 추출 성능을 평가해 본 결과, 제안한 방법으로 형식형태소를 사용할 경우, 성능이 향상되었다.

  • PDF

위치 정보를 위한 기술 모델 (DMLI) 설계 (A Design of DMLI (Description Model for Location Information))

  • 김재원;최오훈;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.34-36
    • /
    • 2006
  • 본 논문은 다양한 위치 획득 시스템에 따라 다른 형식을 가지는 위치 데이터와 이에 따른 표준의 차이를 해결하기 위해 DMLI(Description Model for Location Information)을 제안한다. DMLI는 다른 형식으로 표현된 위치 데이터에 대한 메타데이터를 재정의 하지 않고, 모두의 의미를 포괄하는 메타데이터로 재분류하는 분류체계 모델이다. DMLI는 시설물(Facility), 장소(Place), 서비스(Service) 요소들로 구성된다. 시설물은 공간을 정의하는 최상위 요소로 공간 사용목적과 용도 및 기능에 따른다. 장소는 시설물을 구성하는 최하위 요소다. 서비스는 장소에서 제공 가능한 서비스를 말한다. 또한 위치관련 메타데이터 요소간의 정보를 정의한 사전을 이용하여 기존의 위치 데이터에 대한 메타데이터 요소를 DMLI에서 제안한 메타데이터 요소로 변환이 가능하다. 사전을 이용함으로서 또 다른 형식의 위치 데이터가 입력되어도 DMLI 형식으로의 변환이 용의하다. DMLI 형식으로 재분류된 위치관련 메타데이터들은 공간 사용 목적과 제공 가능한 서비스를 명확히 표현한다. 또한 위치관련 검색, 통계 등의 서비스를 제공하는 어플리케이션을 통하여 다양하게 응용되어 사용된다.

  • PDF

웹 문서 수집을 위한 효율적인 문서 분류 (Efficient Document Classification for Web Document Collection)

  • 이정훈;전서현;김선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.397-401
    • /
    • 2006
  • 최근 다양한 형식의 웹 문서에서 사용자가 원하는 정보만을 검색 하기위해 웹 문서를 주제별로 분류하여 수집하고, 관리하는 것은 필수적인 요소이다. 즉, 정확하고 빠른 정보 검색을 위한 웹 문서 수집은 문서 형식에 따라 분류되어 수집 되어야 한다. 따라서 웹 환경에서 문서를 구성하는 형식을 텍스트나 이미지 데이터로 구분하고 그 형식에 맞는 분류기법을 사용한다면 정확한 정보 검색이 이루어 질수 있다. 본 논문에서는 텍스트와 URL을 이용한 주제 중심의 하이브리드 웹 문서 분류 방법을 제안한다. 텍스트와 URL을 이용한 분류 방법은 텍스트 형식은 주제 중심의 문서 분류방식을 사용하며, 텍스트 정보의 효용성이 낮은 경우 URL의 주제 분포도를 이용하여 분류하며 수집한다. 이를 통해 여러 가지 형식의 웹 문서가 분류 가능하며, 주제에 따른 문서 분류의 정확도가 높아진다.

  • PDF

형식개념의 외연과 내포격자 (Extent and Intent Lattice on Formal Concept)

  • 연용호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.387-388
    • /
    • 2019
  • 형식개념(Formal Concept)은 외연(extent)과 내포(intent)를 이용하여 어떤 대상에 대한 정의를 내리거나, 그 대상들을 분류하여 군집화하기 위한 논리적 도구로 사용되어왔다. 여기에서 외연이란 객체(Object)들의 집합이고, 내포는 그 객체들이 지니고 있는 속성(Attribute)들의 집합이다. 이러한 형식개념은 어떤 문제에 나타나는 다양한 데이터로부터 객체와 속성들을 추출하고 이로부터 개념(Concept)들의 계층구조(hierarchy)를 형성하여 데이터를 분석하는데 적용될 수 있다. 본 논문에서는 형식개념의 정의와 성질을 소개하고, 이를 일반화한 완비격자에서의 형식개념을 정의한다. 또한 이 형식개념에서의 외연과 내포격자에 대한 성질을 알아본다.

  • PDF

이벤트 탐색을 사용하는 일정 영역 질의 응답 시스템의 구현 (A Domain-Dependent Question-Answering System)

  • 장두성;오종훈;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.414-421
    • /
    • 2001
  • 본 논문에서는 한정된 영역을 대상으로 하는 질의응답 시스템에서 사용자의 질의를 해석하고 적당한 대답을 생성하기 위해 백과사전이나 일반사전 등과 같은 지식원에서 추출된 구조화된 지식을 사용하는 과정을 기술한다. 질의응답을 위하여 지식원은 그 단락의 의미에 따라 구조화되고 각 단락은 논리형식으로 변환되었으며, 논리형식 내 각 개체들은 사전 정의문에 따라 확장되었다. 이 구조화된 지식은 입력된 자연언어 질의문에서 질의의 의도를 추출하고, 질의에 포함되어 있는 지식에 의미속성을 부착하기 위해 사용된다. 지식원의 논리형식 변환을 위해 한국어의 논리형식이 도입되었으며, 사용된 지식원은 우리말 큰사전과 계몽백과사전의 30여개 질병정의문이다.

  • PDF

전기통제용 KORMARC형식의 개발에 관한 연구 (Study on the development of the KORMARC format for authority data)

  • 윤구호
    • 정보관리학회지
    • /
    • 제11권1호
    • /
    • pp.3-16
    • /
    • 1994
  • 전거통제용 KORMARC형식은 서지레코드에서 액세스포인트로 사용될 이름(Name)이나 주제(subject)의 표준형, 표준형으로의 참조 그리고 이들 간의 관계 등과 관련되는 정보를 기술하기 위하여 설계되었다. 이름은 서지레코드에서 기본표목, 주제명부출표목, 총서명부출표목으로 사용될 수 있으며, 주제는 주제명 부출표목으로 사용될 수 있다. 개발된 전거형식은 "USMARC format for authority data including guidelines for content designation"을 기준으로 개발했으며, 기 개발된 "한국문헌자동화목록형식 - 단행본용 - (KS C5867-1993)"과의 호환성을 고려하였다."과의 호환성을 고려하였다.려하였다.

  • PDF

형식적 방법론을 이용한 통신 소프트웨어 개발 지원 환경의 설계와 구현 (Design and Implementation of a Support Environment for Communication Software Development based on Formal Methods)

  • 이은석
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1537-1551
    • /
    • 1998
  • 금후의 고도의 정보화 사회에서 발샐할 다양한 형태의 시스템 요구와 기대에 능동적이고도, 효과적으로 대처해 나가기 위해서는 보다 체계적인 컴퓨터 통신 소프트웨어 개발 방법론의 정비와 확립이 절실히 요구되고 있다. 본 논문에서는 (1)종래의 형식적 기술 기법보다 사용자 친화성(user-friendliness)이 높은 표현 기법으로 통합형 에디터의 제공, (2)(1)에서의 새로운 표현 기법으로부터 국제 표준의 형식적 기술 기법인 LOTOS로의 자동변환법의 제공, (3)형식사양 수준에서의 소프트웨어 재사용의 방법론을 제공한다. 그 결과, 사용자는 특정 FDT(Formal Description Technique)에 대한 깊은 지식이나 충분한 사용 경험이 없어도 시스템에 대한 깊은 지식이나 충분한 사용 경험이 없어도 시스템에 대한 구조적 요구와 동작요구, 데이터요구만 가지고 최종적으로 원하는 형식사양을 생성해 낼 수 있다. 이는 특정 FDT를 직접적으로 이용하는 것 보다 상대적으로 초기 학습의 부담이 적고 기술과 이해가 용이하다.

  • PDF

구조분석 에이전트를 사용한 웹사이트의 평가 (Web Site Evaluation Using Structure Analysis Agents)

  • 정윤경;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.143-145
    • /
    • 2000
  • 인터넷이 보편화되면서 그에 따른 정보량도 급증하고 있다. 웹문서량이 많아짐에 따라 웹문서를 구조를 이용하여 저장, 분석하는 연구가 활발히 이루어지고 있다. 본 논문에서는 웹사이트를 사용자가 평가하기 위해 계층적인 웹문서들의 관계를 사이트맵으로 구성하며 웹문서 내의 계층구조를 추출, 저장하고 그래픽적으로 표시하였다. 이를 위해 웹문서 내의 계층구조를 위해 W3기관의 공용으로 사용되는 Tidy 라이브러리를 이용하여 URL에 대한 HTML 문서를 얻고 이를 XML로 변환하였다. 변환된 XML 결과로 이진트리를 구성하고 계층구조를 표현하였다. 웹문서들의 사이트맵은 그래프형식과 계층구조형식으로 표현했는데 그래프형식을 이용하여 사이트맵의 연결구조를 파악할 수 있게 하였으며, 계층구조를 이용하여 웹문서간의 계층구조에 따른 정보를 얻을 수 있었다. 사이트맵을 구성하기 위해 URL들의 구조를 인접리스트로 저장하였으며, 방향성 그래프형식을 이용하였다. 또한 웹문서 구조를 계층적으로 구성하기 위해 웹문서의 그래프형식에 대해 BFS(Breadth First Search)방식을 이용했다. 또한 계층적 사이트맵을 이용한 평가항목을 이용하여 증권사이트에 대해 실험하였다. 실험을 통해 본 시스템이 웹사이트 평가에 유용성함을 입증하였다.

  • PDF

한국인명의 로마자표기 형식에 대한 연구 (A Research on the Format for Romanization of Korean Personal Name)

  • 김성원;김정우
    • 정보관리연구
    • /
    • 제43권2호
    • /
    • pp.199-222
    • /
    • 2012
  • 한국인들의 국제활동 증대에 따라 외국인들과의 접촉이 증가하였으며 활동의 주체인 한국인 개인을 외국인이 식별해야 하는 필요가 증대되고 있다. 개인을 식별해주는 것은 개인의 이름(personal name)이며, 한글(Hangeul, Korean alphabet)을 모르는 외국인이 한국인을 식별할 수 있도록 하려면 한국인명을 로마자로 표기하는 음성번역(phonetic translation)이 필요하다. 한국인명의 로마자표기 실태를 보면 다양한 형식이 혼용되고 있어 혼돈이 벌어지고 있다. 한국인명을 로마자로 표기하는 과정에서 발생하는 혼돈은 크게 한국인명을 표기하기 위한 로마자 자모의 선택과 표기형식의 상이함에서 비롯된다. 본 연구는 한국인명의 로마자표기를 위한 형식을 검토하여 최적안을 제안하는 것을 목적으로 하였다. 이를 위해 한국과 서구간의 인명 구조와 사용관행의 차이를 살펴보고, 한국인명의 로마자표기의 의미와 관련쟁점을 정리하였으며, 현재 사용되고 있는 다양한 표기형식을 유형화하였다. 이를 기반으로 한국인명의 로마자표기에 사용되고 있는 다양한 형식을 검토하고 최적안이라 판단되는 표기형식을 제안하였다.

한반도 선사시대 굽다리토기 연구

  • 강병학
    • 고문화
    • /
    • 66호
    • /
    • pp.5-35
    • /
    • 2005
  • 본 고는 매우 복잡 다양하게 출토되고 있는 선사시대 토기 중 굽다리토기에 대한 연구이다. 특수한 기형의 이 토기는 분류조차 제대로 이루어지지 않은 채 의례용으로 인식되어져 왔으며, 그 명칭 또한 무분별하게 사용되어져 왔다. 따라서 충분히 객관적이고도 적절한 정립이 필요한 상황이다. 이 토기는 저부와 신부의 상대크기에 따라 대부형(Ⅰ형)과 대각형(Ⅱ)으로의 세부기종 설정이 가능하고 세부기종별 속성분석을 통하여 6형식의 형식분류가 이루어졌다. 무문토기시대 전기 주거지유적에서 공렬 및 각형토기와 공반하는 1·2·3·4형식의 토기(북한→강원영동→경기중부·충청서해안지역)는 점토대토기문화가 도래하면서 생활, 분묘, 생산, 폐기 그리고 의례관련유구에서 출토되는 5·6형식 토기(경기중부·충청서해안→호남·영남지역)로의 변화를 보이면서 전개된다. 즉 점토대토기문화가 도래하는 시점에서 굽다리토기의 형식도 변화·확대되고 있다. 또한 출토맥락, 형식조합, 제작기술 등의 관점에서 공렬 및 각형토기와 공반하는 1·2·3·4형식은 일상 생활용기로의 상정이 가능한 반면 점토대토기와 조합을 이루는 5·6형식 토기는 의례관련유구와 분묘유구에서 다량 출토되고 있어 기원이나 소원과 관련된 의례용기, 그리고 부장용으로의 기능분화가 관찰된다. 〔주제어〕: 굽다리토기, 공렬토기, 각형토기, 점토대토기문화, 기술유형, 시공적 전개, 기능분화

  • PDF