• 제목/요약/키워드: 이름 식별

검색결과 76건 처리시간 0.022초

추상적 텍스트 요약 기반의 메소드 이름 제안 모델 (A Method Name Suggestion Model based on Abstractive Text Summarization)

  • 주한새
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.137-138
    • /
    • 2022
  • 소스 코드 식별자의 이름을 잘 정하는 것은 소프트웨어 엔지니어링에서 중요한 문제로 다루어지고 있다. 프로그램 엔티티의 의미있고 간결한 이름은 코드 이해도에 중요한 역할을 하며, 소프트웨어 유지보수 관리 비용을 줄이는 데에 큰 효과가 있다. 이러한 코드 식별자 중 평균적으로 가장 복잡한 식별자는 '메소드 이름'으로 알려져 있다. 본 논문에서는 메소드 내용과 일관성 있는 적절한 메소드 이름 생성을 자연어 처리 태스크 중 하나인 '추상적 텍스트 요약'으로 치환하여 수행하는 트랜스포머 기반의 인코더-디코더 모델을 제안한다. 제안하는 모델은 Github 오픈소스를 크롤링한 Java 데이터셋에서 기존 최신 메소드 이름 생성 모델보다 약 50% 이상의 성능향상을 보였다. 이를 통해 적절한 메소드 작명에 필요한 비용 절감 달성 및 다양한 소스 코드 관련 태스크를 언어 모델의 성능을 활용하여 해결하는 데 도움이 될 것으로 기대된다.

  • PDF

트래픽 모니터링을 통한 P2P 및 웹 하드 다운로드 응용의 파일이름 식별 방법 (A File Name Identification Method for P2P and Web Hard Applications through Traffic Monitoring)

  • 손현구;김기수;이영석
    • 한국정보과학회논문지:정보통신
    • /
    • 제37권6호
    • /
    • pp.477-482
    • /
    • 2010
  • 최근 파일 공유 및 인터넷 전화, 동영상 스트리밍 같은 진화된 인터넷 응용 서비스들이 등장하고 있다. 특히 P2P 또는 웹 기반 파일 공유 응용 들은 컨텐츠 불법 복제와 소수 사용자에 의한 다량의 트래픽 점유율 동의 문제를 지속적으로 제기하고 있다. 본 논문에서는 트래픽 모니터링을 통하여 P2P 응용 및 웹하드 응용에서 다운로드 받는 파일이름을 식별하는 방법을 제안하고 이의 실험 결과를 제시한다. 파일 이름을 식별하기 위해서 패킷 페이로드 내에 존재하는 한글 문자열을 디코딩하는 방법을 이용하였고, BitTorrent, 클럽박스 및 tple을 대상으로 실험하여 다운로드받는 파일이름을 탐지할 수 있음을 보였다.

ORCID 기반의 학술 연구 결과물 저자명 식별 시스템 구축 방안에 관한 연구 (A Study on the Construction Methods for Author Identification System of Research Outcome based on ORCID)

  • 조재인
    • 한국비블리아학회지
    • /
    • 제24권1호
    • /
    • pp.45-62
    • /
    • 2013
  • 전통적인 전거 통제는 단위 시스템에 한정될 뿐 아니라, 그 대상도 도서관 소장 자원으로 국한되어 있다. 그러나 학술 논문은 인터넷 환경에서 상업 출판사, 기관 레포지토리 등으로 자유롭게 유통되고 있어, 시스템을 넘어선 글로벌한 개념의 이름 식별 체계가 필요하다. 최근 연구자 이름 식별 체계가 도서관계, 출판계를 망라한 글로벌 링크를 지향하게 되면서 ORCID가 출범하였다. ORCID는 학술지 출판사들이 그동안 기계적 클러스터를 통해 운영해 왔던 각종 ID 시스템, 대학의 연구 업적 시스템, 학술지 논문 투고 시스템 등을 파트너로 기존의 ID를 투명하게 링크할 뿐 아니라, 저자가 셀프 클레임을 통해 자신의 실적물을 식별할 수 있도록 하는 방식이다. 그러나 해외 출판물을 중심으로 운영되고 있는 ORCID를 국내 저자 이름 식별에 바로 적용하기는 어렵다. 따라서 본 연구에서는 저자명 식별의 글로벌한 동향을 밝히고, ORCID를 심층 분석한 후, 이를 응용한 국내 학술 연구 결과물 저자명 식별 시스템 구축 방향을 제안하였다.

전거제어를 위한 국제표준이름식별자(ISNI)의 활용가능성에 관한 연구 (A Study on the Applicability of ISNI for Authority Control)

  • 이미화
    • 정보관리학회지
    • /
    • 제31권3호
    • /
    • pp.133-151
    • /
    • 2014
  • 본고는 정보산업 분야 전체를 포괄하는 연계식별자로서 ISNI의 중요성을 인식하여 ISNI의 개념 및 전거제어에서 이의 활용가능성을 모색하고자 하였다. ISNI는 창작, 생산, 관리, 내용 배포의 흐름에서 정보매체 내용산업 전체와 관련된 개인(Party)의 대중개체(Public Identities) 식별을 위한 연계식별자로 전세계 망라적 이름 전거제어를 위해 필요하다. 우선 ISNI의 개념, 목적, 용어, 식별자구조, ISNI 할당원칙, 관리방식, 메타데이터에 대해 조사하였다. 이를 바탕으로 전거제어에서 활용가능성을 모색하였다. 첫째, 국내 협력 전거제어를 위해 ISNI의 개념을 도입하는 것을 고려해야 할 것이다. 국내에 맞는 ISNI 체제인 KISNI를 구축하여 도서관 및 정보산업 분야에서 생산되는 모든 전거데이터를 상호 활용할 수 있도록 할 수 있다. 둘째, 연계식별자인 ISNI를 이용하여 여러 식별자를 연계함으로 링크드데이터 구축이 가능하게 될 것이다. 셋째, 서지레코드 및 전거레코드에 ISNI 식별자를 기술할 수 있도록 KORMARC을 확장해야 할 것이다.

국제표준이름식별자(ISNI)를 중심으로 한 연구자 식별자의 통합관리체계 연구 (A Study on Integrated Management System of Researcher Identifiers based on the ISNI (International Standard Name Identifier))

  • 변회균;오복희
    • 한국비블리아학회지
    • /
    • 제29권3호
    • /
    • pp.139-155
    • /
    • 2018
  • 이 연구는 연구자 정보를 관리하기 위해 여러 조직에서 발행하고 관리하는 다양한 식별자를 국제표준이름식별자(ISNI)를 중심으로 융합 관리함으로써 식별자의 중복발행을 방지하고 기관의 연구자 정보의 재정비에 활용할 수 있는 연구자 식별자 통합관리체계 모형을 제시하였다. 여러 식별자 중에 다양한 분야에서도 적용할 수 있는 ISNI의 메타데이터 구조와 관리체계를 살펴보고, ISNI를 중심으로 각 기관에서 발행하는 식별자를 통합하여 관리할 수 있는 체계와 시스템 모형을 설계하였다. 이 모델은 데이터구조 계층, 플랫폼 계층, 어플리케이션 계층, 관리 및 보안계층(4계층)으로 구성되며 주요 기능의 설명 및 통합관리시 고려해야할 이슈를 제시하였다.

클래스 특성 기계학습에 기반한 클래스 이름의 접미사 검증 기법 (Validation Technique for Class Name Postfixes Based on the Machine Learning of Class Properties)

  • 이홍석;이준하;이일로;박수진;박수용
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권6호
    • /
    • pp.247-252
    • /
    • 2015
  • 소프트웨어의 규모가 커지고 복잡성이 증가함에 따라 소프트웨어의 유지보수가 보다 중요해지고 있으며 유지보수성에 많은 영향을 미치는 요인 중 하나는 소스코드 가독성이다. 가독성의 90% 이상 영향을 끼치는 요인은 소스코드에서 사용되는 식별자들의 이름이며 이를 위한 기존 연구들에서는 클래스의 식별자로 사용된 어휘를 이용하여 식별자의 이름을 검증한다. 하지만 대부분의 관련 연구는 그 특성상 개체의 도메인 관련 특성만을 고려하게 되며 클래스 내의 어휘가 적절하지 못한 경우 적용할 수 있는 범위가 한정적이라는 한계점이 있다. 본 논문에서는 클래스의 특성을 추출하여 의사결정트리 기법을 통해 기계학습을 시킨 후 클래스 역할 모델을 생성하며 이를 이용하여 이름을 검증할 대상 클래스의 역할에 해당하는 접미사를 추천하게 되어 클래스 이름 검증 보고서를 생성한다. 본 연구 기법의 효용성을 검증하기 위해 4개의 오픈소스 프로젝트에 대하여 본 연구 기법을 적용하였고 클래스 역할 정보를 담고 있는 5개의 접미사에 대해 정확도와 재현율, ROC 곡선과 같은 지표를 제시하였다.

인용분석에서의 모호한 저자명 식별을 위한 방법들에 관한 고찰 (Review of Author Name Disambiguation Techniques for Citation Analysis)

  • 김현정
    • 한국비블리아학회지
    • /
    • 제23권3호
    • /
    • pp.5-17
    • /
    • 2012
  • 서지 데이터베이스를 이용한 인용분석연구를 진행하기 이전에 이루어져야 할 과정 중 하나가 모호한 저자명의 식별이라고 할 수 있다. 대부분 서지 데이터베이스에는 저자의 성(姓)과 이름의 이니셜만을 표기하는 경우가 많은데, 중국이나 한국 등 아시아 국가 출신의 연구자들은 같은 성을 가진 사람이 매우 많고, 이름의 이니셜까지 같은 경우도 상당히 많아서 이름검색만으로 찾고자 하는 저자를 식별해내기가 쉽지 않기 때문이다. 아시아 국가 출신의 학자들이 유난히 많은 연구분야들에서는 이러한 문제들이 더더욱 큰 문제가 되며, 인용분석 뿐만 아니라 일반적인 정보검색에서도 매우 중요한 요인이 될 수 있다. 모호한 저자명을 식별해내는 방법에는 자동화된 알고리듬을 이용하여 각각의 저자를 식별해내는 방법과 저자 클러스터링을 얻어내기 위해 일일이 수작업으로 데이터셋을 구축하는 방법, 그리고 두 가지 방법을 혼용한 반자동화된 방법 등이 있다. 본 연구는 "모호한 저자명 식별"을 위해 개발된 여러 가지 방법들을 고찰해보기로 한다.

실용영어에서 고유명사 일치를 위한 자료구조 (Efficient Data Structures of Coreference Resolution for Proper Names)

  • 김종선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.207-209
    • /
    • 1998
  • 고유명사가 문장속에서 다시 언급될때는 여러 가지 변형된 형태로 나타난다. 즉 같은 의미의 이름으로 사용되면서 서로 다른 이름 형태를 갖게 된다. 이러한 경향은 coreference 처리를 어렵게 만든다. 본 논문에서는 고유명사의 coreference와 의미상으로 인식되지 않은 고유명사의 식별에 이용될 수 있는 효율적인 자료구조를 제시한다.

  • PDF

광역 컴퓨팅 환경에서 분산 객체의 통합 바인딩 서비스의 최적 객체 선정 (Optimal Object Selection of Integrated Binding Service for Distributed Objects in Wide Area Computing Environments)

  • 전병택;정창원;주수종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1499-1502
    • /
    • 2002
  • 최근 분산 컴퓨팅 환경은 인터넷 기반으로 규모가 확장됨에 따라 광역 컴퓨팅 환경으로 변화되고 있다. 이러한 환경에서 클라이언트가 원하는 객체나 자원들의 투명성을 제공하는 메커니즘은 필수적이다. 그러나 기준의 네이밍 또는 트레이딩 서비스가 다루는 객체에 대한 식별자는 이름 대 주소 그리고 속성 대 주소의 한쌍으로 이루어져 위치에 따라 객체나 자원에 대한 식별자를 변경해야 하는 문제점을 갖는다. 특히, 이동 객체와 중복객체에 대한 위치 서비스는 더더욱 제공하기 어렵다. 이러한 문제점을 해결하기 위해 식별자를 이름/속성에 따르는 객체 핸들 그리고 컨택 주소로 나누고 각각 독립적인 서비스로 관리하는 통합 바인딩 서비스를 제안하였다. 본 논문에서는 통합 바인딩 서비스에서 위치서비스가 관리하는 컨택 레코드 상에 컨택 주소가 여러 개가 등록이 되어 있을 경우, 중복된 객체를 의미한다. 이러한 중복된 객체들 중에 이들이 존재하는 서버의 부하정보를 이용하여 하나의 컨택 주소를 선택하는 과정을 보였다.

  • PDF