• 제목/요약/키워드: Support Vectors

검색결과 169건 처리시간 0.024초

SVM 기계학습을 이용한 웹문서의 자동 의미 태깅 (Automatic semantic annotation of web documents by SVM machine learning)

  • 황운호;강신재
    • 한국산업정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.49-59
    • /
    • 2007
  • 본 논문은 시맨틱 웹의 실현을 위해서는 필수적인 작업인 웹문서의 의미를 자동으로 태깅할 수 있는 시스템에 관한 것이다. 웹상의 방대한 자원을 일일이 사람이 수작업으로 의미를 태깅한다는 것은 사실상 불가능하기 때문에 한국어 웹문서를 대상으로 대량의 학습 데이터를 수집하고 자연어처리 기법과 시소러스를 이용하여 특징을 추출한 후 SVM 기계학습을 통하여 개념분류기를 구축하였다. 한국어의 특징을 파악하여 의미 태깅에 필요한 특징 정보를 추출하기 위해서 형태소 분석과 구문 분석을 하였다. 추출된 특징정보는 가도카와 시소러스의 의미코드를 이용하여 학습벡터로 구성되는데, 이는 유사한 단어나 구를 하나의 개념코드로 매핑하여 시스템의 재현율을 높이는 역할을 하게 된다. 실험결과 자동 의미 태깅 분야에서 본 접근방법의 가능성을 확인할 수 있었다.

  • PDF

B형 간염 바이러스의 돌연변이 내면항원의 발현 및 분비 (Expression and Secretion of Hepatitis B Viral Mutant Core Antigen)

  • 김용석;김성기;노현모
    • 미생물학회지
    • /
    • 제27권3호
    • /
    • pp.169-175
    • /
    • 1989
  • 포유동물 세포내에서 간염 바이러스의 내면항원의 발현과 전위내면 항원(precore) 부위의 역할을 규명하기 위하여 고등동물세포 발현용 벡터에 전위내면항원 부위를 갖거나 또는 갖지 않는 내면항원 유전자를 클로닝 하여 COS 세포내에서의 발현을 조사하였다. 전위내면항원 부위를 포함한 내면항원 유전자를 갖는 플라스미드로감염시킨 COS 세포는 항원들이 세포추출물과 배양액에서 검출되었다. 분비된 항원의 증가율은 감염후 2일과 3일 사이가 가장 높았고, 부분결실된 제조합 플라스미드 중 내면항원의 ATG codon에서 180bp 떨어진 것이 가장 발현이 잘 되었다. 전위내면항원을 갖지 않거나 하나의 염기가 첨가되어 변형된 전위내면항원을 갖는 제조합 플라스미드의 경우 항원들이 세포 추출물에서만 검출되었다. 이러한 사실은 전이내면항원 부위가 HBe 항원의 분비에 관여 한다는 경우 항원들이 세포 그러나 대장균이나 효모 세포의 경우는 전위내면항원의 존재와 상관없이 항상 세포추출물에서만 존재하는 것으로 보아 이들 세포의 경우에서는 전위내면항원 부위가 HBe 항원의 분비에 영향을 줄 수 없음을 의미한다.

  • PDF

Temperature-Dependent Expression of Escherichia coli Thioredoxin Gene

  • Lee, Jin-Joo;Park, Eun-Hee;Ahn, Ki-Sup;Lim, Chang-Jin
    • BMB Reports
    • /
    • 제33권2호
    • /
    • pp.166-171
    • /
    • 2000
  • Thioredoxin is a multifunctional protein that is ubiquitous in microorganisms, animals and plants. Previously, the expression of the Escherichia coli thioredoxin gene (trxA) was found to be negatively regulated by cAMP. In the present study, the effect of temperature on the expression of the E. coli trxA gene was investigated. In order to examine the temperature effect, the fusion plasmid pCL70 that harbors the E. coli trxA P1P2 promoter was used. The other two fusion plasmids, pJH3 and pMH521 that were constructed in different vectors which harbor the E. coli trxA P2 promoter, were also used. When the E. coli strain MC1061/pCL70 was grown in a rich medium at $25^{\circ}C$, $34^{\circ}C$ and $42^{\circ}C$, the cells grown at $42^{\circ}C$ gave the highest $\beta$-galactosidase activity. The E. coli MC1061/pJH3 and MC1061/pMG521 cells showed increased $\beta$-galactosidase activity after the shift of the culture temperature to $42^{\circ}C$. The wild-type trxA gene of the E. coli MC1061 cells produced much higher thioredoxin activity at the higher temperature. These results support the conclusion that the E. coli trxA gene is regulated in a temperature-dependent manner. Especially the expression from its P2 promoter appeared to be sensitive to temperature.

  • PDF

슈퍼 픽셀기반 무인항공 영상 영역분할 및 분류 (Super-Pixel-Based Segmentation and Classification for UAV Image)

  • 김인규;황승준;나종필;박승제;백중환
    • 한국항행학회논문지
    • /
    • 제18권2호
    • /
    • pp.151-157
    • /
    • 2014
  • 최근 무인항공기는 군사용뿐만 아니라 민간용으로도 많이 사용되고 있다. 무인항공기는 미리 입력된 좌표에 따라 GPS 정보를 이용하여 자동비행한다. 그러나 재밍이나 외부 교란에 의해 GPS 신호를 수신할 수 없으면 자동비행이 불가능 해진다. 이러한 문제를 해결하기 위한 한 방법으로, 본 연구에서는 무인기에 탑재된 카메라로부터 촬영된 영상으로부터 실시간으로 특정 영역을 검출하고 인식하는 알고리즘을 제안한다. 실시간 분류와 기계 학습에 사용할 특징을 추출하기 위한 전처리 과정으로 군집화 알고리즘인 그래프 기반 분할 알고리즘을 사용하여 슈퍼 픽셀화 하였다. 다양한 컬러모델 및 혼합 컬러 모델을 비교 분석하여 가장 이상적인 혼합 모델을 선정하고, 분류 알고리즘으로는 적은 트레이닝 데이터로도 뛰어난 분류 성능을 낼 수 있는 서포트 벡터 머신을 사용하였다. 무인항공 영상으로부터 18개의 컬러와 텍스처 특징 벡터를 추출하고 학습 및 예측과정을 통해 하천, 비닐하우스, 논 등 3 종류의 영역을 실시간으로 분류하였다.

스캔 포맷 변환이 있는 효율적인 MPEG-2 동영상 트랜스코딩을 위한 고속 움직임 추정 기법 (Fast Motion Estimation Algorithm for Efficient MPEG-2 Video Transcoding with Scan Format Conversion)

  • 송병철;천강욱
    • 방송공학회논문지
    • /
    • 제8권3호
    • /
    • pp.288-296
    • /
    • 2003
  • ATSC (Advanced Television System Committee)에서는 18가지의 DTV (Digital Television)를 위한 동영상 포맷들을 제정하였다. ATSC 포맷들은 스캔 포맷, 크기 포맷, 프레임율 포맷 등의 적당한 조합들이다. 효과적인 MPEG-2 트랜스코딩을 위해서는 이런 포맷들 간의 변환도 지원할 수 있어야 한다. 여러 포맷 변환들 중에서 특히 스캔 포맷 변환은 프레임율과 크기 변화가 함께 일어나기 때문에 상대적으로 구현하기가 힘들다. 스캔포맷 변환으로 픽쳐 타입도 함께 변하기 때문에 트랜스코더의 움직임 추정부 (motion estimation; ME)에 상당한 연산량 부담을 주게 된다. 이런 문제를 해결하기 위해 본 논문은 스캔포맷 변환을 지원하는 MPEG-2 동영상 트랜스코딩을 위한 고속 움직임 추정 알고리즘을 제안한다. 먼저, 트랜스코더의 수신단은 입력 비트열로부터 재 부호화(re-encoding)에 적합한 후보 움직임 벡터들을 추출한다. 그런 다음. 가중치 중간값 선택기(weighted median selector)를 이용하여, 여러 후보 움직임 벡터들 중에서 최적의 움직임 벡터를 선택한다. 모의 실험 결과는 제안한 움직임 추정 알고리즘이 전역 탐색 기법(Full Search Algorithm: FSA)에 비해 현저하게 적은 연산량을 가지면서, FSA와 거의 동일한 PSNR 성능을 가짐을 증명한다.

음향 신호의 양방향적 연관성을 고려한 유해 콘텐츠 검출 기법 (Pornographic Content Detection Scheme Using Bi-directional Relationships in Audio Signals)

  • 송광호;김유성
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.1-10
    • /
    • 2020
  • 본 논문에서는, 최근 인터넷을 통해 빠르게 확산하고 있는 음향 중심의 음란 콘텐츠를 정확하게 검출하기 위해, 음향의 이웃 신호들 사이에 존재하는 양방향적 연관성을 기반으로 콘텐츠의 유해성을 판단하는 기법을 제안한다. 이웃한 음향 신호들간의 양방향적 연관성을 추출하기 위하여, 양방향 확장-인과 컨벌루션 연산(bi-directional dilated-causal convolution operation)들을 수행하는 확장-인과 컨벌루션 블록을 쌓아 만든 다층구조 양방향 확장-인과 컨벌루션 네트워크를 제안한다. 제안된 유해 콘텐츠 검출 기법의 효용성 검증을 위한 실험에서는 음향 신호의 각 시점으로부터 추출한 단순 특징 벡터를 기계학습 모델로 분류하는 기존 방법, 기존의 확장-인과 컨벌루션 블록을 적용해 음향 시계열 데이터의 순 방향 연관성만을 이용하는 기법, 그리고 본 연구에서 제안한 음향 시계열 데이터의 양방향 연관성까지 이용하여 유해성을 판단하는 기법의 분류 정확성을 비교하였다. 실험 결과에 의하면 본 연구에서 제안한 기법이 최대 84.38%의 인식 정확도를 가지며 이는 기존의 단순 특징 벡터를 이용하는 방법보다 약 25.80% 높고 순 방향 연관성만을 이용하는 기법보다 약 3.10% 높은 것으로 분석되었다.

트래픽 데이터의 통계적 기반 특징과 앙상블 학습을 이용한 토르 네트워크 웹사이트 핑거프린팅 (Tor Network Website Fingerprinting Using Statistical-Based Feature and Ensemble Learning of Traffic Data)

  • 김준호;김원겸;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권6호
    • /
    • pp.187-194
    • /
    • 2020
  • 본 논문은 클라이언트의 익명성과 개인 정보를 보장하는 토르 네트워크에서 앙상블 학습을 이용한 웹사이트 핑거프린팅 방법을 제안한다. 토르네트워크에서 수집된 트래픽 패킷들로부터 웹사이트 핑거프린팅을 위한 훈련 문제를 구성하며, 트리 기반 앙상블 모델을 적용한 웹사이트 핑거프린팅 시스템의 성능을 비교한다. 훈련 특징 벡터는 트래픽 시퀀스에서 추출된 범용 정보, 버스트, 셀 시퀀스 길이, 그리고 셀 순서로부터 준비하며, 각 웹사이트의 특징은 고정 길이로 표현된다. 실험 평가를 위해 웹사이트 핑거프린팅의 사용에 따른 4가지 학습 문제(Wang14, BW, CWT, CWH)를 정의하고, CUMUL 특징 벡터를 사용한 지지 벡터 기계 모델과 성능을 비교한다. 실험 평가에서, BW 경우를 제외하고 제안하는 통계 기반 훈련 특징 표현이 CUMUL 특징 표현보다 우수하다.

16 비트 고정 소수점 DSP를 이용한 다채널 G.729A음성 부호화기의 실시간 구현 (Real-time Implementation of a Multi-channel G.729A Speech Coder on a 16 Bit Fixed-point DSP)

  • 안도건;유승균;최용수;이재성;강태익;박성현
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.45-51
    • /
    • 2000
  • 본 논문에서는 16 비트 고정 소수점 DSP(Digital Signal Processor)를 사용하여 다채널 G.729A 음성 부호화기를 실시간 구현하였으며, 실제로 음성 사서함 서비스(Voice Mailing Service: VMS) 시스템에 응용하였다. DSP는 TI(Texas Instruments)사의 TMS320C549 칩을 사용하였으며, 구현된 G.729A음성 부호화기는 채널 당 부호화기에 14.5 MIPS를, 복호화기에 3.6 MIPS를 소요하였으며, 메모리는 코드 부분에 9.88 K 워드, 데이터 부분에 1.69 K 워드를 필요로 하였다. 결과적으로 개발된 VMS 시스템에는 두 개의 DSP를 사용하여 DSP 당 4 채널씩 총 8 채널을 수용하였다. 실험 결과, 구현된 다채널 부호화기는 ITU-T에서 제공된 테스트 벡터 샘플을 모두 통과하는 일관된 성능을 보였다.

  • PDF

지도학습에서 다양한 입력 모델에 의한 초단기 태양광 발전 예측 (Forecasting of Short Term Photovoltaic Generation by Various Input Model in Supervised Learning)

  • 장진혁;신동하;김창복
    • 한국항행학회논문지
    • /
    • 제22권5호
    • /
    • pp.478-484
    • /
    • 2018
  • 본 연구는 기온, 강수량, 풍향, 풍속, 습도, 운량, 일조, 일사 등 시간별 기상 데이터를 이용하여, 일사 및 일조 그리고 태양광 발전예측을 하였다. 지도학습에서 입출력패턴은 예측에서 가장 중요한 요소이지만 인간이 직접 결정해야하기 때문에, 반복적인 실험에 의해 결정해야 한다. 본 연구는 일사 및 일조 예측을 위하여 4가지 모델의 입출력 패턴을 제안하였다. 또한, 예측된 일조 및 일사 데이터와 전라남도 영암 태양광 발전소의 발전량 데이터를 사용하여 태양광 발전량을 예측하였다. 실험결과 일조 및 일사 예측에서 모델 4가 가장 예측결과가 우수했으며, 모델 1에 비해 일조의 RMSE는 1.5배 정도 그리고 일사의 RMSE는 3배 정도 오차가 줄었다. 태양광 발전예측 실험결과 일조 및 일사와 마찬가지로 모델 4가 가장 예측결과가 좋았으며, 모델 1 보다 RMSE가 2.7배 정도 오차가 줄었다.

A Hybrid Proposed Framework for Object Detection and Classification

  • Aamir, Muhammad;Pu, Yi-Fei;Rahman, Ziaur;Abro, Waheed Ahmed;Naeem, Hamad;Ullah, Farhan;Badr, Aymen Mudheher
    • Journal of Information Processing Systems
    • /
    • 제14권5호
    • /
    • pp.1176-1194
    • /
    • 2018
  • The object classification using the images' contents is a big challenge in computer vision. The superpixels' information can be used to detect and classify objects in an image based on locations. In this paper, we proposed a methodology to detect and classify the image's pixels' locations using enhanced bag of words (BOW). It calculates the initial positions of each segment of an image using superpixels and then ranks it according to the region score. Further, this information is used to extract local and global features using a hybrid approach of Scale Invariant Feature Transform (SIFT) and GIST, respectively. To enhance the classification accuracy, the feature fusion technique is applied to combine local and global features vectors through weight parameter. The support vector machine classifier is a supervised algorithm is used for classification in order to analyze the proposed methodology. The Pascal Visual Object Classes Challenge 2007 (VOC2007) dataset is used in the experiment to test the results. The proposed approach gave the results in high-quality class for independent objects' locations with a mean average best overlap (MABO) of 0.833 at 1,500 locations resulting in a better detection rate. The results are compared with previous approaches and it is proved that it gave the better classification results for the non-rigid classes.