• 제목/요약/키워드: 대용량 분류

검색결과 243건 처리시간 0.032초

보행자 대중교통 안내 서비스 연구 (A Study on Public Transportation Integrated Pedestrian Path Information Service)

  • 김재권;배은실;변우섭;박상봉
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2005년도 하계학술대회
    • /
    • pp.3-9
    • /
    • 2005
  • 무선통신 기술과 정보 기술을 이용해서 사용자 무선 단말에 다양한 정보를 제공하는 텔레매틱스 서비스는 차량 운전자, 탑승자 및 보행자 등 사용자에 따라 다양한 형태의 서비스로 진화하고 있다. 또한 무선통신망의 발전으로 인해 광대역 통신의 대용량 텔레매틱스 서비스로의 발전이 기대되고 있다. 본 논문에서는 텔레매틱스 서비스 중에서 대중교통의 편리한 사용을 위한 보행자 위주의 길안내 서비스에 대해 논한다. 보행자 대중교통 안내 서비스를 위한 요구 사항을 기반으로 서비스 기능을 정의하고 서비스를 분류함으로써 보행자의 도보 및 대중교통 안내 서비스를 제안한다. 보행자 대중교통 안내 서비스는 보행자 도보 길안내 기능, 출발지와 목적지 기반의 One-Stop 대중교통 안내 기능, 대중교통 정보 제공 기능, 경로 예약 기능, 개인화 기능으로 분류할 수 있으며 각 기능의 정의 및 구성 요건들을 제안한다.

  • PDF

데이터 마이닝을 위한 개선된 직사각형 분해 알고리즘 (An Improved Rectangular Decomposition Algorithm for Data Mining)

  • 송지영;임영희;박대희
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.265-272
    • /
    • 2003
  • 본 논문에서는 동적으로 변화하는 대용량의 데이터베이스로부터 보다 현실적인 데이터 마이닝의 수행을 가능케 하기 위하여 기존의 직사각형분해 알고리즘을 개선한 새로운 알고리즘을 제안한다. 새로운 알고리즘은 이진 행렬을 이분(bipartite) 그래프로 변환하고, 변환된 이분 그래프에서 이분클리크(biclique)를 찾음으로써 직사각형 분해를 수행한다 제안된 알고리즘은 새롭게 유도된 수학적 정리들을 바탕으로 출발하였으며, 복잡도 분석을 통하여 그 효율성을 보이고, 기존의 분류 방법론과의 비교를 통하여 제안된 방법론이 규칙의 수와 분류율면에서 우수함을 보인다.

주요성분분석을 이용한 Polynomial Adaline의 성능개선 (Performance Improvement of Polynomial Adaline Using Principal Component Analysis)

  • 조용현;박용수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.313-316
    • /
    • 2001
  • 본 논문에서는 입력변수들의 차원을 감소시켜 polynomial adaline의 성능을 개선하는 방법을 제안하였다. 제안된 방법에서는 적응적 학습알고리즘의 주요성분분석 기법을 이용하여 입력변수의 특징을 추출하고 이를 polynomial adaline의 학습데이터로 이용하였다. 이는 주요성분분석 기법이 가지는 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 속성을 살려 입력데이터의 차원을 감소시킴으로서 고차원의 데이터에 따른 polynomial adaline이 가지는 제약을 해결하기 위함이다. 제안된 기법의 polynomial adaline을 5 개의 입력변수를 가진 패턴분류 문제에 적용하여 시뮬레이션한 결과, 기존의 다차원 polynomial adaline보다 더욱 우수한 분류성능이 있음을 확인할 수 있었다. 그리고 커널함수의 평활요소 설정 면에서도 우수한 특성이 있음을 확인할 수 있었다.

  • PDF

점진적 학습 기술 기반 범용적인 분류기 구조설계 방법의 설계 및 구현 (Design and Implementation of a Generic Classification System Based on Incremental Learning Technology)

  • 민병원;오용선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.425-426
    • /
    • 2019
  • 전통적인 마이닝 기법은 다양한 디지털 매체와 센서 등에서 생산되는 빅데이터를 처리하기 어려울 뿐 아니라 신규 데이터 누적시 전체 데이터를 재분석 해야하는 비효율성과 대용량의 문서를 학습함에 있어 메모리부족 문제, 학습 소요시간 문제 등이 있다. 이러한 문제를 해결하기 위하여 본 논문에서는 자질축소 기법에 의존하지 않고 대량의 문서를 자유롭게 학습하고 부분적인 자질 추가 변경 시에 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법을 설계 및 구현하였다. 점진적 학습 모듈은 일반적인 학습 방법이 데이터의 추가 및 변동시마다 모든 데이터를 재학습하는 데 반해, 기존의 학습 결과에 증분된 데이터만 재처리 없이 추가적으로 학습한다. 재학습을 위해 사용자는 작업 수행 중 자원 관리를 통해 기존에 처리된 데이터를 자유롭게 가져와서 새로운 데이터와 병합이 가능하다. 이러한 점직적 학습 효율성은 빅데이터 기반 데이터 처리에 주요한 특성인 데이터 생산 속도를 극복하기 위한 좋은 대안이 될 수 있음을 확인하였다.

  • PDF

점진적 빅데이터 학습기반의 전자저널 구독가치 큐레이션 서비스 (Journal Subscription Value Curation Service Based on Incremental Big Data Learning)

  • 이정원;진성일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.409-410
    • /
    • 2019
  • 점진적 빅데이터 학습 기반의 전자저널 구독가치 큐레이션 서비스는 대용량의 학술정보 처리환경을 하드웨어 기반에서 소프트웨어 기반으로 데이터를 학습함에 있어 학습 소요시간 및 메모리 부족 문제 등을 해결하기 위해 널리 사용하는 자질축소 기법에 의존하지 않고 대량의 데이터를 자유롭게 학습하고 증분 데이터 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법이다. 학술정보의 논문요약과 참고문헌의 데이터 수집 정제 분류 저장 분석을 통해 활용할 수 있는 지표를 생성하여 도서관 학교 공공기관 연구기관 등에 제공하여 기관에서 구독하고 있는 학술지가 연구에 얼마나 활용되고 있는지를 판단하는 정보 가용성을 활용한 양질의 정보원을 확보하여 불필요한 저널 구독을 중단하고 연구자가 요구하는 품질 좋은 학술정보를 제공할 수 있는 서비스로 일반적인 학술문헌 이용도 평가방법과 달리 구독 가치에 대한 지표를 제공하는 큐레이팅 방법이다.

  • PDF

토픽 기반의 지식그래프를 이용한 BERT 모델 (Topic-based Knowledge Graph-BERT)

  • 민찬욱;안진현;임동혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.557-559
    • /
    • 2022
  • 최근 딥러닝의 기술발전으로 자연어 처리 분야에서 Q&A, 문장추천, 개체명 인식 등 다양한 연구가 진행 되고 있다. 딥러닝 기반 자연어 처리에서 좋은 성능을 보이는 트랜스포머 기반 BERT 모델의 성능향상에 대한 다양한 연구도 함께 진행되고 있다. 본 논문에서는 토픽모델인 잠재 디리클레 할당을 이용한 토픽별 지식그래프 분류와 입력문장의 토픽을 추론하는 방법으로 K-BERT 모델을 학습한다. 분류된 토픽 지식그래프와 추론된 토픽을 이용해 K-BERT 모델에서 대용량 지식그래프 사용의 효율적 방법을 제안한다.

포즈 변형을 이용한 포인트 클라우드 압축 (Point Clouds Compression Using Pose Deformation)

  • 이솔;박병서;박정탁;서영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.47-48
    • /
    • 2021
  • 본 논문에서는 대용량의 3D 데이터 시퀀스의 압축을 진행한다. 3D 데이터 시퀀스의 각 프레임에서 Pose Estimation을 통해 3D Skeleton을 추출한 뒤, 포인트 클라우드를 skeleton에 묶는 리깅 과정을 거치고, 다음 프레임과 같은 자세로 deformation을 진행한다. 다음 프레임과 같은 자세로 변형된 포인트 클라우드와 실제 다음 프레임의 포인트 클라우드를 비교하여, 두 데이터에 모두 있는 점, 실제 다음 프레임에만 있는 점, deformation한 데이터에만 있는 점으로 분류한다. 두 데이터에 모두 있는 점을 제외하고 나머지 두 분류의 점들을 저장함으로써 3D 시퀀스 데이터를 압축할 수 있다.

  • PDF

조건(암, 정상)에 따라 특이적 관계를 나타내는 유전자 쌍으로 구성된 유전자 모듈을 이용한 독립샘플의 클래스예측 (Class prediction of an independent sample using a set of gene modules consisting of gene-pairs which were condition(Tumor, Normal) specific)

  • 정현이;윤영미
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권12호
    • /
    • pp.197-207
    • /
    • 2010
  • 대용량(High-throughput) 형태로 얻어진 cDNA 마이크로어레이 데이터에 다양한 데이터 마이닝 기법을 적용하면 서로 다른 조직에서 추출한 유전자의 발현정도를 비교할 수 있고 정상세포와 암세포에서 발현량의 차이를 보이는 DEG(Differently Expression Gene) 유전자를 추출할 수 있다. 이들을 이용하여 병을 진단할 수 있을 뿐만 아니라, 암의 진행 단계(Cancer Stage)에 따른 치료 방법을 결정할 수 있다. 마이크로어레이를 기반으로 한 대부분의 암 분류자는 기계학습 기법을 이용하여 암 관련 유전자를 추출하여, 이들 유전자를 총체적으로 이용하여 독립 샘플의 클래스(암, 정상)를 판정한다. 하지만 유전자의 발현량의 차이뿐만 아니라 유전자와 유전자의 상관관계의 변화가 질병 진단에 활용될 수 있다. 대부분의 질병은 단독 유전자의 변이에 의한 것이 아니라 유전자의 모듈로 이루어진 유전자조절네트워크의 변이에 의한 것이기 때문이다. 본 논문에서는 조건에 따라 특이적 관계를 나타내는 유전자 쌍을 식별하여, 이들 유전자 쌍을 이용한 유전자 분류 모듈을 생성한다. 분류 모듈을 이용한 암 분류 방법이 기존의 암 분류 방법보다 높은 정확도로 암과정상 샘플을 분류함을 보여주고 있다. 분류 모듈을 구성하는 유전자의 수가 상대적으로 적으므로 임상키트로의 개발도 고려할 수 있다. 향후 분류 모듈에 속하는 유전자의 기능적 검증을, GO(Gene Ontology)를 활용함으로서, 밝혀지지 않은 새로운 암 관련 유전자를 식별하고, 분류 모듈을 확대하여 암 특이적 유전자조절네트워크 구성에 활용할 계획이다.

단백질 서열의 n-Gram 자질을 이용한 세포내 위치 예측 (Classification Protein Subcellular Locations Using n-Gram Features)

  • 김진숙
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.12-16
    • /
    • 2007
  • 단백질의 기능은 그 기능을 발휘하는 세포내의 위치와 밀접한 연관이 있다. 따라서 새로운 단백질의 서열이 밝혀지면 이 단백질의 세포내 위치를 규명하는 것은 생물학적으로 매우 중요한 일이다. 이 논문에서는 단백질의 n-그램과 kNN (k-Nearest Neighbor) 분류기를 이용한 새로운 세포내 위치예측 방법을 다룬다. 이 방법은 입력 단백질 서열과 가장 유사한 가중치를 가지는 k개의 단백질이 가지는 세포내 위치 정보들을 취합하여 입력 단백질의 세포내 위치를 추정한다. 단백질간의 유사도 가중치는 두 단백질서열의 5-그램 자질의 유사도를 비교하여 계산된다. 단백질의 세포내 위치예측 정확도를 검증하기 위해 SWISS-PROT 단백질 데이터베이스로 부터 세포내 위치가 알려진 51,885개의 서열을 추출하여 대용량 테스트 컬렉션을 구축하였으며, 다른 연구자들이 제공하는 또 하나의 소용량 테스트 컬렉션을 실험에 사용하였다. 이 논문에서 사용한 예측방법은 대용량 테스트컬렉션에 대해 약 93%의 정확도를 보여주었으며, 소용량 데스트컬렉션을 이용하여 이전 실험과 비교하였을 때도 이 방법이 다른 시스템에 비해 성능이 우월함을 알 수 있었다.

  • PDF

초고속 대용량 광통신을 위한 광집적 소자 기술 동향 (Technical Trends of Photonic Integrated Circuits for High Speed, High Capacity Optical Communication)

  • 백용순
    • 전자통신동향분석
    • /
    • 제24권6호
    • /
    • pp.52-60
    • /
    • 2009
  • 인터넷의 보급과 더불어 폭발적으로 늘어나기 시작한 데이터 통신은 FTTH의 보급과 IPTV, VoD 등 본격적인 멀티미디어 수요의 증가에 따라 매 18개월마다 통신량이 2배씩 증가하는 "광 무어의 법칙"이 성립되고 있다. 지속적인 대역폭의 증가를 수용하기 위해서는 핵심 광부품의 소형화 및 저가화가 반드시 필요하며 이러한 요구사항 수용을 위한 핵심요소는 광집적화 기술 개발을 통한 광소자의 고집적화 및 고속화 달성이다. 광집적화 기술은 크게 두 가지 분류로 나눌 수 있는데 이종 물질간의 하이브리드결합에 의한 구현과 단일 혹은 유사 물질에 의한 모놀리식 집적에 의한 방법이다. 본 고에서는 하이브리드 집적 및 모놀리식 집적 기술의 핵심 요소 및 기술발전 현황에 대해 살펴본다.