• 제목/요약/키워드: 이미지 크롤링

검색결과 37건 처리시간 0.033초

건설현장 영상 분석을 위한 웹 크롤링 기반 학습 데이터베이스 구축 자동화 (Automated Training Database Development through Image Web Crawling for Construction Site Monitoring)

  • 황정빈;김진우;지석호;서준오
    • 대한토목학회논문집
    • /
    • 제39권6호
    • /
    • pp.887-892
    • /
    • 2019
  • 건설현장 영상 자동 모니터링을 목적으로 많은 연구자들이 영상분석기술을 활발히 개발하고 있다. 높은 성능의 영상분석기술을 개발하기 위해서는 다량의 고품질 학습용 이미지 데이터베이스(Database, DB)를 구축해야 한다. 하지만 기존의 학습 DB 구축 방법은 사람이 건설현장을 직접 방문하여 카메라를 설치하고 각각의 목적에 알맞은 영상을 수집하여 DB를 직접 구축하고 있기 때문에 이에 많은 비용과 시간이 요구된다. 뿐만 아니라 이 같은 사람 의존적인 방식은 건설현장의 다양한 특성을 모두 반영한 DB를 구축하는 것에 한계가 있다. 이러한 한계를 극복하기 위해서 본 연구는 웹 크롤링(Web Crawling) 기법을 활용하여 건설현장 영상분석을 위한 학습 이미지 DB를 자동으로 구축하는 프레임워크를 제안한다. 프레임워크 검증을 위해 건설공종과 건설장비에 대한 학습 DB를 구축하여 영상분석모델을 학습 및 평가하는 실험을 진행하였다. 그 결과, 건설현장 모니터링을 위한 학습용 이미지 DB를 자동으로 구축할 수 있었을 뿐만 아니라 이를 토대로 개발한 영상분석모델이 건설공종과 건설장비를 성공적으로 분류하는 것을 확인하였다. 결과적으로 기존의 방식보다 학습 DB를 구축하는 데 필요한 시간과 비용을 최소화할 수 있었다.

회귀 분석을 통한 경마 순위 예측 모형 (A Model for Predicting Horse Racing Ranking by Regression Analysis)

  • 허태성;송민섭;고동수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.15-16
    • /
    • 2022
  • 본 논문에서는 국내 합법 사행산업의 가장 큰 비중을 차지하는 경마에 대한 데이터 분석 모델을 제공하여 건전한 국민 여가 스포츠로 인식 개선을 제안한다. 고배당을 강조하는 경마 예측론이 성행하며 경마가 스포츠가 아닌 도박에 가깝다는 부정적 이미지를 개선하고자 부모마의 수득 상금을 이용한 순위 분석 모델을 제공한다. 현재 국내 경마 경기는 서울, 부산, 제주에서 개최되며, 이 중 서울 지역 경마 데이터를 분석 데이터로 하였다. 분석에 이용한 데이터는 2019년 3월부터 2022년 3월까지의 경주 성적, 경주마 정보, 부모마 수득상금을 이용하였다. 분석에는 선형 회귀 모형, 랜덤 포레스트 회귀 모형 (Breiman, 2001)을 이용하였다. 분석은 Python 을 이용하였으며, Python에서 제공하는 다양한 라이브러리를 이용하여 크롤링, 전처리, 분석하였다.

  • PDF

GAN을 활용한 사용자 입력 기반의 대량 이미지 생성 및 거래 플랫폼 'GANerate' ('GANerate', A Mass Image Creation and TradingPlatform based on User Input using GAN)

  • 최필환;한종원;최연아;박정민;유상오
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.922-923
    • /
    • 2023
  • 인터넷에는 많은 이미지 데이터가 존재하지만, 대규모 이미지를 효과적으로 수집하는 것은 어려운 실정이다. 본 논문은 GAN을 통해 사용자가 지정한 개수만큼 원하는 이미지를 생성하는 웹 플랫폼을 제안한다. 기존의 단일 이미지다운, 크롤링, 웹 스크래핑을 통한 이미지 데이터 수집 방법보다 다량 이미지 데이터를 안전하게 수집할 수 있을 것으로 기대된다.

이미지 특징점을 활용한 권리관리정보 갱신 기법 (A Rights Management Information Updating Technique Using Image Feature Points)

  • 홍덕기;김일환;김영모;김석윤
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.463-465
    • /
    • 2018
  • 공유저작물을 이용하는데 있어서 권리관리정보(RMI, Rights Management information)를 제대로 파악하지 못하거나 제대로 된 정보를 제공 받지 못하는 경우 이용자들은 저작권분쟁에 휘말릴 수 있다. 이러한 이유로 공유저작물을 제공하는 사이트에서는 공유저작물에 대한 정확하고 최신의 RMI 정보를 제공하기 위하여 통합하여 관리하고 최신의 정보로 갱신해야 한다. 하지만 동일한 권리를 가진 이미지는 다양한 이미지 포맷과 사이즈 변경에 따라 다른 형태로 유통되기 때문에 이에 대한 갱신처리가 중요하다. 본 논문에서는 이미지 특징점 기술을 활용하여 권리관리정보에 대한 중복데이터 문제를 해결할 수 있는 기법을 제시한다.

  • PDF

스타일 분석을 통한 커플 매칭 플랫폼 (Couple Matching Platform through Style Analysis)

  • 최형락;조성언;김동하;문재현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2019
  • 본연구는 커플들의 이미지 빅 데이터를 분석하여 각각 얼굴과 패션에 따라 유사한 유형 끼리 클러스터링 하여 새로운 사람 이미지가 주어졌을 때 해당 사람이 어느 유형에 속하는지 찾아내고 해당 유형의 사람들은 어떤 유형의 이성과 잘 맞는지 찾아 추천해주는 플랫폼이다. 빅 데이터를 수집하기 위하여 SNS상에서 커플들의 이미지를 크롤링하여 저장한다. 수집된 커플들의 이미지를 AI 머신 러닝으로 나이, 성별을 분석하여 미리 설정한 나이대의 이성 커플들의 이미지 만을 추려내서 각각 남, 여의 이미지를 분리하여 저장한다. 해당 이미지들로 비슷한 얼굴, 패션 유형의 사람들을 같은 클러스터로 모으고 CNN 으로 학습 시켜서 새로운 이미지가 들어올 경우 효율적으로 해당 이미지가 어느 클러스터에 속하는지 찾아낼 수 있도록 한다. 특정 이미지가 속하는 클러스터를 찾아내면 해당 클러스터에 속하는 사람들의 연인들이 어느 클러스터에 가장 많이 포함되어 있는지 찾아서 해당 클러스터 유형의 이성을 추천해준다. 웹과 어플리케이션으로 이루어진 플랫폼 서비스이며, 커플 매칭 기능 뿐만 아니라 매칭된 회원 간 연락 기능, 실제 커플의 이미지로 두 사람의 매칭도 확인 등의 부가적 기능 또한 인공 지능 서비스로 제공된다.

데이터셋 생성을 위한 이미지 URI 및 메타데이터 수집 크롤러 (For creating a Dataset Image URI and Metadata Collection Web Crawler)

  • 박준홍;김석진;정연욱;이동욱;정영주;서동만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1082-1084
    • /
    • 2019
  • 인공지능 학습에 대한 관심이 증가하면서 학습에 필요한 데이터셋 구축에 필요한 많은 양의 데이터가 필요하다. 데이터셋 구축에 필요한 데이터들을 효과적으로 수집하기 위한 키워드 기반 웹크롤러를 제안한다. 구글 검색 API 를 기반으로 웹 크롤러를 설계하였으며 사용자가 입력한 키워드를 바탕으로 이미지의 URI 와 메타데이터를 지속적으로 수집하는 크롤러이다. 수집한 URI 와 메타데이터는 데이터베이스를 통해 관리한다. 향후 다른 검색 API 에서도 동작하고 다중 쓰레드를 활용하여 크롤링하는 속도를 높일 예정이다.

머신러닝을 위한 데이터셋 수집 RPA 개발 (Development of Dataset Cllection RPA for Machine Learning)

  • 김기태;서보인;윤상혁;이세훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.295-296
    • /
    • 2020
  • 본 논문에서는 RPA(Robotic Process Automation) Tool 개발 과정 중 머신 러닝, 딥러닝에 필요한 이미지 크롤링 및 전처리 기능을 이용한 가공된 데이터 셋 처리 과정을 기술한다. 개발된 RPA 툴에서 머신러닝 및 딥러닝에 사용될 데이터 확보 기능을 제공하며, 세부적으로 이미지 전처리(Convert Gray, Histogram Equalization, Binary, Resize)등 반복적으로 사용되는 기능들을 제공한다. 개발된 툴을 통해 RPA의 자동화 기능과, 전처리 기능의 융합을 통해 업무의 효율성을 제공한다.

  • PDF

딥러닝을 이용한 이미지 레이블 추출 기반 해시태그 추천 시스템 설계 및 구현 (Design and Implementation of Hashtag Recommendation System Based on Image Label Extraction using Deep Learning)

  • 김선민;조대수
    • 한국전자통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.709-716
    • /
    • 2020
  • 소셜 미디어에서 일반적으로 게시물을 올릴 때 이미지의 태그 정보를 사용하는데, 태그를 이용하여 주로 검색이 이루어지기 때문이다. 사용자는 태그를 게시물에 붙임으로써 게시물을 많은 사람들에게 노출시키길 원한다. 또한, 사용자는 게시물과 함께 태깅될 태그를 붙이는 행위를 번거롭게 여겨 태깅하지 않은 게시물도 올리게 된다. 본 논문에서는 입력 이미지와 유사한 이미지를 찾아 해당 이미지에 부착된 레이블을 추출하여 그 레이블이 태그로 존재하는 인스타그램의 게시물들을 찾아 게시물 속 존재하는 다른 태그들을 추천해주는 방법을 제안한다. 제안하는 방법에서는 CNN(Convolutional Neural Network) 딥러닝 기법의 모델을 통하여 이미지로 부터 레이블을 추출하여 추출된 레이블로 인스타그램을 크롤링하여 레이블 외의 태그를 정렬하여 추천해준다. 추천된 태그를 이용하여 이미지를 게시하기도 편해지고, 검색의 노출을 높일 수 있고, 검색오류가 적어 높은 정확도를 도출할 수 있음을 알 수 있다.

컨볼루셔널 뉴럴 네트워크를 이용한 주인공 식별 기반의 영상장면 탐색 기법 (A scene search method based on principal character identification using convolutional neural network)

  • 권명규;양형식
    • 융합정보논문지
    • /
    • 제7권2호
    • /
    • pp.31-36
    • /
    • 2017
  • 본 논문은 대량의 영상에서 특정 출연자가 나오는 영상부분을 탐색하여 재생하고자 한다. TV영상 프로그램에서 주인공이나 특정 장면을 탐색 하려면 영상을 플레이하거나 코너를 설정하여 시청한다. 기존 방식은 장면 탐색이나 코너별 시청시 수동으로 offset값을 설정 하여야만 한다. 그러나 본 논문에서 제안하는 방식은 주인공 얼굴을 학습 시킨후 영상인식으로 주인공을 찾고 주인공이 등장하는 장면으로 이동하여 영상을 재생 하게 된다. 특정 출연자에 대한 데이터는 크롤링 기법을 활용하여 추출 및 수집한다. 수집된 데이터를 기반으로 컨볼루셔널 뉴럴 네트워크 알고리즘을 사용하여 학습하고 이를 이용하여 성능 평가를 진행한다. 성능 평가는 드라마를 재생하면서 추출된 키 프레임에서 학습 된 특정 출연자를 추출, 판단하는 방법으로 정확도를 측정한다. 학습된 장면을 얼마나 빨리 그리고 정확하게 탐색 하는지 성능 확인결과 약 93%의 정확도를 확보하였다. 도출된 성능을 기반으로 특정 장면만을 시청하는 코너별 시청, 인물 탐색 및 상세정보 retrieval 등 영상서비스에 응용 하고자 한다.

CNN 을 이용한 동전 분류 (Coin Classification using CNN)

  • 이재현;신동규;박이준;송현주;구본근
    • Journal of Platform Technology
    • /
    • 제9권3호
    • /
    • pp.63-69
    • /
    • 2021
  • 각국에서 통용되는 동전 제작에 사용되는 제한된 종류의 재질과 동전의 휴대성 등을 고려한 디자인은 각국의 통화가 달라도 동전의 모양, 크기, 색상을 비슷하게 하였다. 이로 인해 여러 국가를 방문하는 사람은 비슷한 모양의 여러 나라 동전을 식별하는 것에 어려움을 겪는다. 이러한 문제를 해결하기 위해 본 논문에서는 이미지 처리에 효과적인 합성곱 신경망(CNN)을 이용한 동전 분류 방법을 제안한다. 동전 분류를 위한 학습 이미지는 웹 크롤링을 이용하여 수집하고, 이미지 전처리를 위해 OpenCV를 사용하였다. 전처리가 완료된 이미지를 대상으로 특징 추출을 위해 세계층의 합성곱 계층을 사용하였고, 분류를 위해 두 계층의 완전연결 신경망을 사용하였다. 본 논문에서 설계한 모델이 동전 분류에 효과가 있음을 보이기 위해 여덟 종류의 동전을 대상으로 시험하였다. 실험 결과에 의하면 동전 분류의 정확도는 약 99.5%이다.