• 제목/요약/키워드: 개체 기반

검색결과 921건 처리시간 0.028초

객체 버전화를 중심으로 시간지원 개체-관계 모델의 시간지원 객체 지향 모델로 변환 (Transforming an Entity-Relationship Model into a Temporal Object Oriented Model Based on Object Versioning)

  • 이홍로
    • 인터넷정보학회논문지
    • /
    • 제2권2호
    • /
    • pp.71-93
    • /
    • 2001
  • 개체-관계 모델은 데이터베이스 설계와 시스템 분석을 위해서 시간 응용 분야에서 사용되고 있는 개념적 모델로서, 현실세계의 시간 문제 영역을 논리적 모델로 표현하기 위한 기반이 된다. 객체 지향 모델은 실세계의 이력 자료에 대한 개체와 관계성을 데이터베이스 시스템에 표현하는데 적합한 논리적 모델로서, 이력 자료의 병행적 지원과 시공간 자료의 조작 등을 적절하게 표현하고자 하는 응용분야에서 이용되고 있다. 현실세계 개체의 표현을 정확하게 모델링하기 위해서는 아주 적은 제약조건을 갖고 E-R 모델을 객체 지향 모델로 변환하는 방법이 필요하다. 또한 시간지원 객체 지향 모델은 시간 의미를 객체 지향 모델에 추가하여 시간에 따라 변화된 정보를 처리할 수 있는 논리적 모델이다 시간지원 객체 지향 모델의 두 부류는 시간을 결합하는 단위에 따라 속성 버전화와 객체 버전화로 나누어진다. 이 두 가지 중에서 객체 지향 모델은 이 상태와 행위의 재사용성을 증가시키고 개체들 사이의 유기적 관계를 효율적으로 표현할 수 있기 때문에 객체 지향 모델의 연구가 필요하다. 그런데 개체-관계 모델을 객체 지향 모델로 변환하기 위한 기법과 제약조건이 수반된다. 그래서 시간 개념이 포함된 개체-관계 모델을 객체 지향 모델로 변환하는 연구가 필요하다. 따라서 현실세계의 객체 버전화를 위한 이력 개체를 정확하게 표현하기 위해서 본 논문은 E-R 모델을 객체 지향 데이터베이스 모델로 변환하기 위한 기법을 제시하고 있다 즉. 현실세계의 개체와 관계를 데이터베이스에 표현하는데 적합한 시간지원 객체 지향 모델로 일반화, 집단화와 연관화에 대한 역할에 따라 변환하며, 그리고 다형성 관점에서 일반화 상속과 집단화 상속을 조합하여 기능을 확장한다. 이 변환과 확장은 데이터베이스 설계의 논리적 모델 설계 및 재사용성을 증가시키는데 기여할 것이다.ing, and e-mail. A room for HEE, in which teaming activity mainly occurs by following the sequences of learning procedures, includes other sub-rooms for the guidance of Loaming, discussion, directories for reference, question and answer, submission of homework, evaluation, and an encyclopedia. Therefore, this study implicates: 1) achievement of teaming environment using the ICT mainly made by students who solve problems closely related to daily life, 2) development of practical learning questionnaires fitted in the present state, 3) preparation for the curriculum. Finally, from this study, I suggested that further studies are needed to develop models for learning, interaction between students and teachers, and the learning materials under the Web based loaming environment.tion, and Environmental Replacement. Third, by selecting Chung na environmental park in Incheon, which is a filtration plant lot,

  • PDF

개체추출기법을 이용한 관계성 도출기법 (A Study of Relationship Derivation Technique using object extraction Technique)

  • 김종희;이은석;김정수;박종국;김종배
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.309-311
    • /
    • 2014
  • 최근, 산재된 비정형 데이터 분석 등을 통한 빅데이터 활용에 대한 요구들이 증가하고 있으나, 아직까지 이에 대한 연구들이 부족한 실정이다. 따라서 본 연구에서는 수집된 웹 정보에서 개체들을 추출하여 이들 간의 관계를 집단지성 기술과 언어처리 기술을 통해 자동 분석해 냄으로써 문장단위의 의미기반 분석을 할 수 있는 기법을 제시한다. 이를 위해, 수집된 정보를 DBMS에 정형화된 형태로 저장한 후 형태소와 자질정보를 분석한다. 획득한 형태소 중 관심개체, 주변개체, 비관심 개체를 분류하고 개체간 속성인식기법을 이용하여 각 개체간의 관계를 정도, 범위, 성격 등으로 분석한다. 그 결과, 긍정 부정의 판단이 가능한 개체간의 관계성 도출기법을 제시함으로써, 특정 키워드를 대상으로 분석된 정보들의 연관도를 분석할 수 있었다. 이 연구를 통해, 최근 실시간 대용량 처리 시스템에 적합한 시스템을 설계하여 이를 부가가치가 높은 서비스에 적용할 수 있는 방법을 제시하였다.

  • PDF

텍스트마이닝을 이용한 윤동주 연구의 개체계량학적 분석 (Entitymetrics Analysis of the Research Works of Dong-ju Yun using Textmining)

  • 박진균;김택윤;송민
    • 한국비블리아학회지
    • /
    • 제28권1호
    • /
    • pp.191-207
    • /
    • 2017
  • 이 연구는 텍스트마이닝 기술을 이용한 개체계량학적 분석을 인문학 분야 인물 연구에 적용하기 위해 수행하였다. 연구 대상으로 한 인물은 작품뿐만 아니라 종교, 생애에 대해 많은 연구가 이루어진 윤동주를 선정하였다. 본 논문에서는 윤동주 관련 연구 1,076건을 수집하여 이중에서 초록 정보를 가지고 있었던 220건의 논문을 대상으로 LDA(Latent Dirichlet Allocation) 방식의 토픽모델링 분석을 수행하였으며, 참고문헌 정보를 추출할 수 있었던 121건의 논문을 대상으로 저자동시인용 분석을 통해 연구의 동향을 살펴보았다. 또한 초록에서 인명, 작품명의 개체를 추출하여 이들의 관계를 살펴보았다. 이 연구를 통해 윤동주에 관련한 연구 동향은 생애, 시, 실존의식, 비교문학, 번역문학, 종교적 신념에 대한 연구로 다양한 분야에 걸쳐 이루어졌다는 것을 데이터를 기반으로 보다 객관적으로 분석해 볼 수 있었으며, 윤동주와 함께 연구되는 다른 인물이 어떤 작품을 매개로 하여 연구되어 왔는지에 대해서도 알 수 있었다. 이러한 결과는 인문학 분야의 지적구조를 밝히는데 개체계량학적 방법이 유용함을 증명하는 한편 인문학연구의 새로운 시각적 접근을 제안했다는 데에 의의가 있다.

시맨틱 웹 온톨로지에서의 OWL sameAs 적용 (Applying OWL SameAs to an Ontology in the Semantic Web)

  • 강인수;정한민;이승우;김평;이미경;성원경
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권4호
    • /
    • pp.359-367
    • /
    • 2007
  • 차세대 시맨틱 기술 적용의 비전인 시맨틱 웹의 성공을 위해서는 그 기반 지식이 되는 온툴로지의 생산, 공유 및 연계가 전제되어야 함과 동시에 온툴로지를 구성하는 개체들의 정합성이 보장되어야 한다 온툴로지 개체 정합성 측면에서 두 개의 서로 다른 온툴로지 개체가 실세계에서 동일한 개체임을 표현하기 위한 방편으로 OWL에서는 sameAs가 사용될 수 있다. 그러나, 최근까지의 시맨틱 웹 응용 연구에 있어서 sameAs 적용과 관련된 문제점과 고려사항들이 충분히 고찰되지 못했다. 이 연구는 과학기술 연구분야 온툴로지에서의 sameAs 적용 사례를 소개함으로써 sameAs와 관련된 이해의 폭을 공유하고자 한다.

1997 외환위기 지식그래프: 디지털 아카이브의 관계 중심적 접근 (A Knowledge Graph of the Korean Financial Crisis of 1997: A Relationship-Oriented Approach to Digital Archives)

  • 이유경;김학래
    • 한국기록관리학회지
    • /
    • 제20권4호
    • /
    • pp.1-17
    • /
    • 2020
  • 정보기술의 발전에 따라 아카이브의 디지털화가 가속화되고 있다. 그런데 전통적인 방식의 디지털 아카이브는 기록을 효과적으로 검색하고 연계하고 이해하는 데 한계가 있다. 본 논문은 디지털 아카이브의 활용성을 극대화하기 위한 방안으로 관계 중심의 지식그래프 방식을 제안한다. 디지털 아카이브의 사례인 '1997 외환위기 아카이브'의 특징을 검토하고, 아카이브에 포함된 모든 개체와 개체 사이의 관계는 RiC-O(Records in Contexts-Ontology) 기반의 지식그래프로 구축한다. 본 연구의 결과인 외환위기 지식그래프는 1997 외환위기 아카이브의 모든 개체를 기계가 처리할 수 있는 형식으로 구축한다. 디지털 아카이브와 비교해 지식그래프 접근은 개체의 정보, 개체 사이의 관계를 정확히 탐색할 수 있고, 이를 통해 의미검색, 지능형 서비스에 활용될 수 있다.

남도문화예술 아카이브 구축을 위한 기초 연구 - 기술요소를 중심으로 - (A Study for Establishment of Namdo Cultural Arts Archives - Focused on the Description Elements and Classification System for Cultural Arts -)

  • 정대근;홍소람;강혜라
    • 한국도서관정보학회지
    • /
    • 제50권2호
    • /
    • pp.311-337
    • /
    • 2019
  • 본 연구는 남도 지역 문화예술자원의 구조화를 목적으로 하였으며, 기술요소를 도출하여 다양한 문화예술자원을 통합적으로 서비스하는데 기여하고자 하였다. 이 연구에서는 문헌연구 및 사례연구를 통해 자원 개체 16개 요소 51개 하위요소, 개별 행위개체 2개 요소, 16개 하위요소, 행위주체 개체 8개 요소, 32개 하위요소, 시설 개체 2개 요소, 16개 하위요소를 도출하였다. 도출된 자료를 기반으로 전문가 자문을 거쳐 자원, 개별 행위활동, 행위주체, 시설 등 4개 개체, 28개 요소, 117개 하위요소를 도출하였다. 지역적 관점, 문화예술자원 관점, 문화예술인 관점에서 본 연구에서 제시된 기술요소는 타 연구와 구분된다.

사전학습 언어모델을 활용한 범죄수사 도메인 개체명 인식 (A Named Entity Recognition Model in Criminal Investigation Domain using Pretrained Language Model)

  • 김희두;임희석
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.13-20
    • /
    • 2022
  • 본 연구는 딥러닝 기법을 활용하여 범죄 수사 도메인에 특화된 개체명 인식 모델을 개발하는 연구이다. 본 연구를 통해 비정형의 형사 판결문·수사 문서와 같은 텍스트 기반의 데이터에서 자동으로 범죄 수법과 범죄 관련 정보를 추출하고 유형화하여, 향후 데이터 분석기법을 활용한 범죄 예방 분석과 수사에 기여할 수 있는 시스템을 제안한다. 본 연구에서는 범죄 수사 도메인 텍스트를 수집하고 범죄 분석의 관점에서 필요한 개체명 분류를 새로 정의하였다. 또한 최근 자연어 처리에서 높은 성능을 보이고 있는 사전학습 언어모델인 KoELECTRA를 적용한 제안 모델은 본 연구에서 정의한 범죄 도메인 개체명 실험 데이터의 9종의 메인 카테고리 분류에서 micro average(이하 micro avg) F1-score 99%, macro average(이하 macro avg) F1-score 96%의 성능을 보이고, 56종의 서브 카테고리 분류에서 micro avg F1-score 98%, macro avg F1-score 62%의 성능을 보인다. 제안한 모델을 통해 향후 개선 가능성과 활용 가능성의 관점에서 분석한다.

개인정보 비식별화를 위한 개체명 유형 재정의와 학습데이터 생성 방법 (Re-defining Named Entity Type for Personal Information De-identification and A Generation method of Training Data)

  • 최재훈;조상현;김민호;권혁철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.206-208
    • /
    • 2022
  • 최근 빅데이터 산업이 큰 폭으로 발전하는 만큼 개인정보 유출로 인한 사생활 침해 문제의 관심도 높아졌다. 자연어 처리 분야에서는 이를 개체명 인식을 통해 자동화하려는 시도들이 있었다. 본 논문에서는 한국어 위키피디아 문서의 본문에서 비식별화 정보를 지닌 문장을 식별해 반자동으로 개체명 인식 데이터를 구축한다. 이는 범용적인 개체명 인식 데이터에 반해 비식별화 대상이 아닌 정보에 대해 학습되는 비용을 줄일 수 있다. 또한, 비식별화 정보를 분류하기 위해 규칙 및 통계 기반의 추가적인 시스템을 최소화할 수 있는 장점을 가진다. 본 논문에서 제안하는 개체명 인식 데이터는 총 12개의 범주로 분류하며 의료 기록, 가족 관계와 같은 비식별화 대상이 되는 정보를 포함한다. 생성된 데이터셋을 이용한 실험에서 KoELECTRA는 0.87796, RoBERTa는 0.88575의 성능을 보였다.

  • PDF

곤충 발자국 인식을 위한 기여도 기반의 퍼지 가중치 결정 방법 (A Fuzzy Weights Decision Method based on Degree of Contribution for Recognition of Insect Footprints)

  • 신복숙;차의영;우영운
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권12호
    • /
    • pp.55-62
    • /
    • 2009
  • 이 논문에서는 개체를 명확하게 분류하기 어려운 곤충 발자국 영상으로부터 개체를 인식하기 위해서 추출된 특징값 성분들의 기여도를 측정하고, 서로 관계된 기여도에 따라 가중치를 조정하는 퍼지 가중치 결정 방법을 제안한다. 곤충은 몸의 크기가 작아서 발자국은 작은 점의 형태로 나타난다. 그리고 다른 생물체의 발자국과 달리, 규칙적인 형상을 정의하기 어렵고 발자국 데이터와 구분이 분명하지 않는 노이즈와 혼재하기 때문에 개체를 판단하는데 많은 어려움이 있다. 이런 이유로 추출된 곤충 발자국 특징값은 명확하게 구분되는 특징성분 영역과 그렇지 않는 성분을 함께 가지게 된다. 이중 어떤 성분이 다른 성분과 비교하여 다른 클래스와 구분하기에 충분한 변별력을 가질 경우, 개체를 분류하도록 높은 가중치를 할당한다. 산출된 가중치는 퍼지함수에 의해서 출력신호를 결정하고 우세한 출력신호에 의해서 개체를 판단할수 있다. 제안한 기여도 퍼지 가중치 결정 방법을 이용하여 발자국영상의 인식 실험을 수행하고 실험 결과를 제시하였다.

자연어 처리의 개체명 인식을 통한 기록집합체의 메타데이터 추출 방안 (A method for metadata extraction from a collection of records using Named Entity Recognition in Natural Language Processing)

  • 송치호
    • 한국기록관리학회지
    • /
    • 제24권2호
    • /
    • pp.65-88
    • /
    • 2024
  • 본 연구는 인공지능의 하위분야인 자연어 처리(NLP)의 개체명 인식(NER)을 통하여 기록에 내재된 메타데이터 값과 기술 정보를 추출하는 방안에 대한 시험적 연구이다. 연구 대상은 1960~1970년대에 생산된 구로공단 수기 기록물(약 1,200 쪽, 8만여 단어)을 대상으로 하였다. 디지털화를 포함하는 전처리 과정과 함께 기록 텍스트에 대해서 구글의 BERT 언어모델에 기반하여 구현되어 공개된 언어 API를 사용하여 개체명을 인식하였다. 그 결과로 구로공단의 과거 기록에 포함된 173개의 인명과 314개의 조직 및 기관 개체명을 추출할 수 있었고, 이는 기록의 내용에 대한 직접적인 검색어로 사용될 수 있다고 기대된다. 그리고 자연어 처리의 이론적 방법론을 반·비정형의 텍스트로 이루어진 실제 기록물에 적용할 때 발생하는 문제점을 파악하여 해결 방안과 고려해야 할 시사점을 제시했다.