• 제목/요약/키워드: Sub-text

검색결과 199건 처리시간 0.024초

Spam Image Detection Model based on Deep Learning for Improving Spam Filter

  • Seong-Guk Nam;Dong-Gun Lee;Yeong-Seok Seo
    • Journal of Information Processing Systems
    • /
    • 제19권3호
    • /
    • pp.289-301
    • /
    • 2023
  • Due to the development and dissemination of modern technology, anyone can easily communicate using services such as social network service (SNS) through a personal computer (PC) or smartphone. The development of these technologies has caused many beneficial effects. At the same time, bad effects also occurred, one of which was the spam problem. Spam refers to unwanted or rejected information received by unspecified users. The continuous exposure of such information to service users creates inconvenience in the user's use of the service, and if filtering is not performed correctly, the quality of service deteriorates. Recently, spammers are creating more malicious spam by distorting the image of spam text so that optical character recognition (OCR)-based spam filters cannot easily detect it. Fortunately, the level of transformation of image spam circulated on social media is not serious yet. However, in the mail system, spammers (the person who sends spam) showed various modifications to the spam image for neutralizing OCR, and therefore, the same situation can happen with spam images on social media. Spammers have been shown to interfere with OCR reading through geometric transformations such as image distortion, noise addition, and blurring. Various techniques have been studied to filter image spam, but at the same time, methods of interfering with image spam identification using obfuscated images are also continuously developing. In this paper, we propose a deep learning-based spam image detection model to improve the existing OCR-based spam image detection performance and compensate for vulnerabilities. The proposed model extracts text features and image features from the image using four sub-models. First, the OCR-based text model extracts the text-related features, whether the image contains spam words, and the word embedding vector from the input image. Then, the convolution neural network-based image model extracts image obfuscation and image feature vectors from the input image. The extracted feature is determined whether it is a spam image by the final spam image classifier. As a result of evaluating the F1-score of the proposed model, the performance was about 14 points higher than the OCR-based spam image detection performance.

점 행렬을 이용한 새로운 부분 영상 검색 기법 (A Novel Sub-image Retrieval Approach using Dot-Matrix)

  • 김준호;강경민;이도훈
    • 한국산학기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.1330-1336
    • /
    • 2012
  • 영상 검색 방법은 텍스트 기반, 내용 기반, 영역 기반 영상 검색, 부분 영상 검색 방법 등 다양한 연구가 이루어지고 있다. 그 중에 부분 영상 검색은 질의 영상을 포함하는 대상 영상을 찾는 문제이다. 본 논문에서는 생물정보학에서 사용하는 점 행렬 방법을 이용한 새로운 부분 영상 검색 방법을 제안한다. 점 행렬은 두 DNA 서열 간에 유사도를 시각화하는 방법으로써 영상 검색에 적용하여 두 영상 간에 유사도를 비교하는 문제로 재정의한다. 이 알고리즘을 적용하기 위해서 이차원 배열 정보인 영상을 일차원 명암도 영상으로 변환한다. 두 일차원 명암도 영상을 정렬하여 생성된 점 행렬을 이용하여 부분 영상 후보 영역을 생성한다. 실험에는 10 개의 대상 영상과 대상 영상의 부분을 복사한 영상, 축소한 영상, 확대한 영상으로 5종류의 질의 영상을 사용하였다.

서브밴드 가중치를 이용한 잡음에 강인한 화자검증 (Noise Rabust Speaker Verification Using Sub-Band Weighting)

  • 김성탁;지미경;김회린
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.279-284
    • /
    • 2009
  • 화자검증은 발성화자가 제시화자 (claimed speaker)인지 아닌지를 구별하는 것이다. 기존의 화자검증 시스템인 GMM-UBM 방식의 화자검증 시스템은 무잡음 환경에서는 높은 검증성능을 보이지만, 잡음환경에서는 성능이 급격히 떨어지는 단점이 있다. 이런 단점을 극복하기 위해 멀티밴드를 이용한 방법인 특징벡터 재결합방법이 제안되었지만, 특징벡터 재결합방법은 전체 서브밴드 특징벡터들을 사용하여 유사도를 계산하는 단점이 있다. 이런 단점을 극복하기 위해 기 발표된 이전 논문에서 각 서브밴드 유사도를 독립적으로 계산하는 변형된 특징벡터 재결합방법을 제안하였고, 본 논문에서는 변형된 특징벡터 재결합방법과 각 서브밴드들의 신뢰도를 나타내는 신호 대 잡음비를 이용한 가중치를 이용하여 잡음환경에서 기존의 특징벡터 재결합방법에 비해 에러를 28% 감소시켰다.

소프트웨어 TPM 을 사용한 신뢰형 채팅룸 설계 및 구현 (Design and Implementation of Trusted Chatting Room Using Software TPM)

  • 치녜레 그레이스 케네디;조동섭
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2012년도 춘계학술발표대회논문집
    • /
    • pp.259-261
    • /
    • 2012
  • Chatting room has become widely using technology and it is vulnerable to the internet attackers. We proposed a chatting system using a Purebasic programming language to communicate across networks system. Chatting room text is a form of instant messaging between two or group of people. A Communication experiment was designed and implemented to confirm the validity of the developed chatting system on a trusted platform.

  • PDF

한글 폰트의 구조적 코딩 설계 (Hangout Font Generation by using Structural Coding)

  • 김미란;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1989년도 하계종합학술대회 논문집
    • /
    • pp.461-464
    • /
    • 1989
  • This paper deals with the computer generation of Korean characters by the structural coding which results in higher flexibility and compactness. Our method by which Korean characters are designed is characterized as follows : The list of primitives for Korean text is extracted by structural coding rule, and the knowledge-base is used for handling various primitives.

  • PDF

전통(傳統) 상과학(傷科學)에 대한 소고(小考) (A Study of traditional 傷科學)

  • 은석민
    • 한국의사학회지
    • /
    • 제21권1호
    • /
    • pp.77-81
    • /
    • 2008
  • 상과, also called 정골과 in Korea, was a subclass of External Medicine. Of the many sub-fields belonging to Traditional Korean Medicine, 상과 specializes in technological aspects: therefore its preservation and accedence is emphasized. Traditional 상과학 primarily bases clinical diagnosis and treatment on 수기법. Tang dynasty 藺道人's "仙授理傷續斷秘方, the first medical text specializing in 상과, includes detailed description of the 復位, 夾板固定, training, and medicinal treatment stages of treating bone fracture. Jin dynasty 葛洪's "肘後備急方" introduces a fracture treatment method through 竹夾板固定.

  • PDF