• 제목/요약/키워드: 평가 집합

검색결과 841건 처리시간 0.033초

코드클론 표본 집합체 자동 생성기 (Automatic Generation of Code-clone Reference Corpus)

  • 이효섭;도경구
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제7권1호
    • /
    • pp.29-39
    • /
    • 2011
  • 프로그램 내의 코드클론을 찾아주는 도구나 기술들을 평가하기 위해서는 해당 도구가 탐지하는 못하는 클론이 있는지 확인해야 한다. 이를 위해서 샘플 소스코드에 대해서 코드클론을 모두 모아놓은 표준 표본 집합체가 필요하다. 그런데 기존의 코드클론 표본 집합체는 여러 클론탐지 도구의 결과들을 참조해 수작업으로 구축하지만 평가 기준으로 사용하기에는 빠져있는 표본이 많다. 본 연구에서는 자동으로 코드클론 표본 집합체를 생성하는 방법을 제안하고 도구를 구현하였다. 이 도구는 프로그램 소스를 핵심구문트리로 변환한 뒤, 트리를 샅샅이 비교하여 클론 패턴을 찾아낸다. 본 도구는 오탐이 없으며, 특정한 패턴을 제외하고 미탐도 없어서 코드클론 표본 집합체를 자동으로 생성하기 적합하다. 실험결과 상용도구인 CloneDR에서 찾아낸 클론을 모두 포함하면서 2-3배 더 많은 클론들을 찾아내었고, Bellon의 기존 표본 집합체의 클론들을 거의 대부분 포함(93-100%)하면서 자동 구축한 표본 집합체의 크기가 훨씬 크다.

효율적인 문서 처리 작업을 위한 문서집합 나열 (Sequencing Document Clusters to Support Human Annotation Efforts)

  • 나종열;문일철;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.75-78
    • /
    • 2008
  • 온톨로지 어노테이션(Annotation)과정은 수동에 의해 대부분의 문서 처리 작업이 진행되고 있다. 그러므로 계획적이지 않은 문서 처리는 자칫 일관성이나 효율성을 떨어뜨릴 수가 있다. 예를 들어, 처리되는 문서들의 도메인이 자주 바뀌면, 수동 어노테이션을 하는 작업자는 객관성을 잃을 가능성이 높다. 따라서, 본 연구에서는 처리되는 문서집합의 도메인이 최대한 연관성이 유지되도록 처리 문서를 집합하여 나열하는 알고리즘을 소개한다. 첫번째로, 문서들을 유사한 주제 집합으로 형성한다. 두번째로, 두개 이상의 집합에 겹치는 문서들을 계산한다. 마지막으로, 이러한 겹침이 최대화 되도록 문서들의 처리 순서를 나열한다. 본 알고리즘을 IT관련 위키피디아 문서집합을 이용하여 평가를 시행했다. 평가 결과 우리의 알고리즘을 이용하면 처리되는 문서들의 도메인 이동이 무작위로 처리하는 것 보다 연속적이었음을 수치상으로 계산할 수 있었다.

  • PDF

효과적인 빈발 항목 생성 알고리즘T (An Effective Large itemset Generation Algorithm)

  • 채덕진;황부현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.198-200
    • /
    • 2000
  • 대용량의 데이터베이스에서 여러 트랜잭션에 동시에 나타나는 항목들의 모임인 빈발 항목집합을 찾아내는 데이터 마이닝 방법을 연관 규칙 탐사라고 한다. 빈발 항목집합을 찾아내는 데이터 마이닝 방법을 연관 규칙 탐사라고 한다. 빈방 항목집합을 찾아내는 문제는 항목 집합들의 후보 집합을 생성하고 빈발 항목집합의 조건을 충족시키는 후보 집합을 추출함으로써 해결된다. 그리고 이러한 작업은 각각의 빈발 k-항목집합에 대해 k가 증가함에 따라 반복적으로 수행된다. 그러나 연관 규칙 탐사에 관한 기존의 연구는 주로 데이터베이스를 이루는 항목들의 수가 많거나 트랜잭션의 길이가 긴 경우의 대용량 데이터베이스에서 빈발 항목집합의 발견에 초점을 맞추고 있다. 본 논문에서는 데이터베이스를 이루는 전체 항목의 수가 적거나 트랜잭션의 크기가 작은 경우 효과적으로 빈발 항목집합을 찾을 수 있는 연관 규칙 탐사 방법을 제안한다. 그리고 성능 평가를 통하여 제안하는 방법의 성능 및 타당성을 보인다.

  • PDF

해군 전투체계 지원용 전문가시스템의 지식베이스 개발에 관한 연구(구축함 중심) (A Study on the Knowledge Base Development of Expert System for Naval Combat System)

  • 김화수;이정훈
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.183-192
    • /
    • 2002
  • 본 논문에서는 구축함의 대공방어분야에 대한 업무를 IDEF0기능 모델링 방법을 통해 체계적으로 분석하였으며 미국방성의 산하기구인 DARPA에서 연구한 CPOF(Command Post Of Future) 의사결정 모델을 토대로 구축함의 대공방어분야에서 상황평가 단계에 대한 의사결정 과정을 심도 깊게 분석하였다. 또한 구축함의 대공방어분야에서 분석된 업무수행 절차를 토대로 상황평가 단계에서 의사결정과정에 따른 필요한 규칙집합을 식별하고 규칙집합 내부의 규칙들을 효과적으로 추출하기 위하여 규칙집합들에 대한 정의, 규칙에 입력되는 데이터, 규칙집합의 결과값, 규칙집합간의 상호관계를 분석하였다. 이러한 도메인 지식개발은 장차 해군 전투체계 지원용 전문가시스템을 개발하는데 중요한 기회기반이 될 것이다.

  • PDF

비침윤성 방광암 환자의 재발 예측을 위한 유전자 선택 기법 비교 (Comparison of Gene Selection Method for Prediction of Non-muscle Bladder Cancer Recurrence)

  • 이경석;박현우;박수호;윤석중;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.87-89
    • /
    • 2013
  • 이 논문에서는 비침윤성 방광암 환자의 재발 예측을 위해 마이크로어레이 데이터에서 최적의 속성 부분 집합을 찾고 이를 비교 평가한다. 정보 이득(information gain)을 통해 구한 상위 40개, 80개, 100개의 속성 집합과 FCBF(fast correlation based filter) 알고리즘을 적용하여 구한 최적의 속성 부분집합을 SVM 분류 모델에 적용하여 정확도를 비교 평가한 결과 정보 이득을 적용한 상위 100개 속성 부분집합의 분류 정확도가 가장 높게 나왔으며, FCBF 알고리즘을 적용한 속성 집합은 비교적 적은 속성을 사용하면서 이와 비슷한 분류 정확도를 보임을 확인할 수 있었다.

반경 방향 집합조직을 가진 압력관에서의 $K_{IH}$

  • 김성수;주기남;안상복;권상철;김영석;국일현
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1998년도 춘계학술발표회논문집(2)
    • /
    • pp.93-98
    • /
    • 1998
  • CANDU 압력관의 집합조직을 원주 방향 집합조직에서 반경 방향 집합조직으로 변화시켜 $K_{IH}$ 를 평가하였다. 집합조직은 평면 변형에 의한 25% 확관 방법으로 번화시켰고 (0002) direct pole figure와 basal pole component (기저면 성분, Kearns number)로 분석하였다. 반경 방향집합조직의 압력관의 $K_{IH}$ 는 2$50^{\circ}C$에서 17MPa√m 이상으로 나타났으며, 이것은 상용 압력관의 $K_{IH}$ =8-10 MPa√m보다 70% 이상 높은 값이다. 반경 방향 집합조직의 압력관에서 나타나는 $K_{IH}$ 거동을 균열 진전면에서의 기저면 성분과 연계하여 분석하였으며, 평면 면형에 따른 집합조직의 변화는 슬립과 쌍정 기구의 작용으로 설명하였다. 본 연구의 결과는 CANDU 압책관의 delayed hydride cracking (DHC) 저항성 관점에서 반경 방향으로 집합조직을 제어하면 매우 효율적이라는 것을 보여 준다.

  • PDF

베타형 Ti-Nb-Ge 합금의 초탄성 거동에 미치는 집합조직의 영향

  • 김한솔;이해진;송국현;김원용
    • 한국재료학회:학술대회논문집
    • /
    • 한국재료학회 2012년도 춘계학술발표대회
    • /
    • pp.102.1-102.1
    • /
    • 2012
  • Ti 및 Ti 합금은 치과 및 정형외과 등의 분야에서 생체재료로써 다양한 용도로 적용되고 있으며, 보다 안전하고 우수한 특성의 Ti 합금 개발에 대한 관심이 높아지고 있다. 본 연구에서는 Ti-Nb-Ge 합금의 초탄성 특성에 미치는 집합조직의 영향에 대해 조사하였다. 집합조직 제어를 위해 등속 및 이주속 압연을 적용한 후 $850^{\circ}C$에서 30분~2시간까지 어닐링하였다. 광학현미경과 SEM-EBSD를 이용하여 미세조직 및 집합조직을 분석하고, 순환식 인장시험을 통해 시편의 초탄성 특성을 평가하였다. 등속압연 후 어닐링한 시료의 경우 alpha-fiber 집합조직이 발달하는 한편, 이속압연 후 어닐링한 시료는 {113}// 및 {331}의 집합조직이 발달하는 것으로 나타났다. 마르텐사이트 변태에 의한 변형회복능과 집합조직 성분별 강도의 관계를 비교한 결과, alpha-fiber 집합조직이 발달할수록 변형회복능이 증가하는 것으로 나타났다.

  • PDF

소프트웨어 패키지 평가를 위한 평가집합의 생성 및 유지를 위한 메타 모델 (A Metamodel for Creation and Maintenance of Evaluation Set of Software Package Evaluation)

  • 오재원;이종원;박동철;이병정;우치수;김순용;송기평
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.577-590
    • /
    • 2004
  • 오늘날 소프트웨어 산업의 발전은 소프트웨어 패키지 제품들의 양적 팽창을 이루게 하고 있다. 이러한 급속한 소프트웨어 패키지 제품의 증가 추세에 따라서, 사용자가 선택하는 소프트웨어 제품에 대한 품질 인증 요구가 대두되었다. 공산품의 품질 인증과는 달리, 소프트웨어 제품의 경우 아직 인증 역사가 길지 않고 이를 위한 소프트웨어 품질 평가 및 인증 방법 연구는 성숙되지 않았다. 소프트웨어 제품 인증 업무 시 중요한 요소 중의 하나가 평가 집합의 체계적인 생성이다. 평가 집합이란 소프트웨어 제품 유형의 분류에 따라서 소프트웨어 품질 인증을 위한 기준과 메트릭을 명시한 체크리스트를 포함한다. 본 논문에서는 평가 집합의 체계적 생성 및 유지 관리를 위한 베타 모델을 제안한다. 그리고 메타 모델의 유효성을 확인하기 위하여 프로토타입 수준의 평가 집합을 생성한다

한국어 테스트 컬렉션 HANTEC의 확장 및 보완 (Extension and Validation of Hangul Text Collection(HANTEC))

  • 김지영;장동현;맹성현;이석훈;서정현;김현
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.210-215
    • /
    • 2000
  • HANTEC1.0은 12만 건의 문서집합과 30개의 질의집합, 그리고 각 질의에 대한 적합문서로 구성된 정보검색용 한글 테스트 컬렉션이다. 본 연구에서는 HANTEC1.0의 확장 및 보완하기 위해 과학기술분야 20개의 질의를 추가하였는데, 질의 추가를 위해서 일본 NACSIS 테스트 컬렉션의 질의를 번역하여 사용함으로써 한일 교차언어 검색환경을 조성하고자 하였다. 추가된 각 질의에 대해서는 여러 검색기에서 총 41가지 검색방법으로 검색한 후, 각 검색조합의 상위 50개 문서로 구성된 중간 결과집합을 만들었으며, 이를 대상으로 적합성판정에 대한 평가기준 및 절차 교육이 이루어진 평가자가 각 질의에 대한 적합성평가를 실시하였다. 이렇게 구축된 HANTEC 테스트 컬렉션의 적합문서 집합의 객관적 품질 평가와 시스템 성능평가를 위하여 통계적인 방법을 적용하므로써 공신력있고 일반화된 테스트 컬렉션을 구축하고자 하였다. 현재 HANTEC2.0은 검색분야 연구자 및 개발자에게 자유롭게 배포 중이며 정복머색 시스템의 신뢰도 측정을 목적으로 하는 학술대회의 연구결과 발표 및 제품 비교 등에 활용되어질 것이다.

  • PDF

한국어 테스트 컬렉션 HANTEC의 확장 및 보완 (Extension and Validation of Hangul Text Collection(HANTEC))

  • 김지영;장동현;맹성현;이석훈;서정현;김현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.210-215
    • /
    • 2000
  • HANTEC1.0은 12만 건의 문서집합과 30개의 질의집합, 그리고 각 질의에 대한 적합문서로 구성된 정보검색용 한글 테스트 컬렉션이다. 본 연구에서는 HANTEC1.0의 확장 및 보완하기 위해 과학기술분야 20개의 질의를 추가하였는데, 질의 추가를 위해서 일본 NACSIS 테스트 컬렉션의 질의를 번역하여 사용함으로써 한일 교차언어 검색환경을 조성하고자 하였다. 추가된 각 질의에 대해서는 여러 검색기에서 총 41가지 검색방법으로 검색한 후, 각 검색조합의 상위 50개 문서로 구성된 중간 결과집합을 만들었으며, 이를 대상으로 적합성판정에 대한 평가기준 및 절차 교육이 이루어진 평가자가 각 질의에 대한 적합성평가를 실시하였다 이렇게 구축된 HANTEC 테스트 컬렉션의 적합문서 집합의 객관적 품질 평가와 시스템 성능평가를 위하여 통계적인 방법을 적용하므로써 공신력있고 일반화된 테스트 컬렉션을 구축하고자 하였다. 현재 HANTEC2.0은 검색분야 연구자 및 개발자에게 자유롭게 배포 중이며 정보검색 시스템의 신뢰도 측정을 목적으로 하는 학술대회의 연구결과 발표 및 제품 비교 등에 활용되어질 것이다.

  • PDF