• 제목/요약/키워드: Patent big data

검색결과 64건 처리시간 0.023초

특허문서의 IPC 분류기 생성을 위한 데이터 전처리 (Data Pre-processing for Create IPC Classifiers for Patent Documents)

  • 박수현;김진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.542-543
    • /
    • 2024
  • 특허심사절차는 짧지 않은 과정으로 이루어져 있는데, 현재 모든 절차가 사람이 직접 관여하여 진행되고 있다. 특허심사절차의 효율적 시간 분배를 위해, 특허문서 분류 과정의 자동화 처리 필요성을 느끼게 되었다. 따라서, 본 논문에서는 해당 분류기 생성을 위한 데이터의 전처리 과정을 다루었다.

A Technology Analysis Model using Dynamic Time Warping

  • 최준혁;전성해
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.113-120
    • /
    • 2015
  • Technology analysis is to analyze technological data such as patent and paper for a given technology field. From the results of technology analysis, we can get novel knowledge for R&D planing and management. For the technology analysis, we can use diverse methods of statistics. Time series analysis is one of efficient approaches for technology analysis, because most technologies have researched and developed depended on time. So many technological data are time series. Time series data are occurred through time. In this paper, we propose a methodology of technology forecasting using the dynamic time warping (DTW) of time series analysis. To illustrate how to apply our methodology to real problem, we perform a case study of patent documents in target technology field. This research will contribute to R&D planning and technology management.

베이지안 공액 사전분포를 이용한 키워드 데이터 분석 (Keyword Data Analysis Using Bayesian Conjugate Prior Distribution)

  • 전성해
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.1-8
    • /
    • 2020
  • 빅데이터 분석에서 텍스트 데이터의 활용이 증가하고 있다. 따라서 텍스트 데이터의 분석 기법에 관한 많은 연구가 이루어지고 있다. 본 논문에서는 텍스트 데이터로부터 추출된 키워드 데이터의 분석을 위하여 공액사전분포 기반의 베이지안 학습 방법이 연구된다. 베이지안 통계학은 기존의 데이터에 새로운 데이터가 추가될 때마다 모수를 갱신하는 데이터 학습을 제공하기 때문에 시간에 따라 대용량의 데이터가 생성 및 추가되는 빅데이터 환경에서 효율적인 방법을 제공한다. 제안 방법의 성능과 적용 가능성을 보이기 위하여 실제 특허 빅데이터를 전처리하여 구축된 정형화된 키워드 데이터를 분석하는 사례연구를 수행한다.

과학기술 논문의 참고문헌 텍스트 정보를 활용한 기술의 군집화 (Technology Clustering Using Textual Information of Reference Titles in Scientific Paper)

  • 박인채;김송희;윤병운
    • 산업경영시스템학회지
    • /
    • 제43권2호
    • /
    • pp.25-32
    • /
    • 2020
  • Data on patent and scientific paper is considered as a useful information source for analyzing technological information and has been widely utilized. Technology big data is analyzed in various ways to identify the latest technological trends and predict future promising technologies. Clustering is one of the ways to discover new features by creating groups from technology big data. Patent includes refined bibliographic information such as patent classification code whereas scientific paper does not have appropriate bibliographic information for clustering. This research proposes a new approach for clustering data of scientific paper by utilizing reference titles in each scientific paper. In this approach, the reference titles are considered as textual information because each reference consists of the title of the paper that represents the core content of the paper. We collected the scientific paper data, extracted the title of the reference, and conducted clustering by measuring the text-based similarity. The results from the proposed approach are compared with the results using existing methodologies that one is the approach utilizing textual information from titles and abstracts and the other one is a citation-based approach. The suggested approach in this paper shows statistically significant difference compared to the existing approaches and it shows better clustering performance. The proposed approach will be considered as a useful method for clustering scientific papers.

자율주행과 공간정보의 빅데이터 기반 연계성 분석을 통한 동향 및 예측에 관한 연구 (A study on trends and predictions through analysis of linkage analysis based on big data between autonomous driving and spatial information)

  • 조국;이종민;김종서;민규식
    • 지적과 국토정보
    • /
    • 제50권2호
    • /
    • pp.101-115
    • /
    • 2020
  • 자율주행 분야 글로벌 동향 파악 및 공간정보 서비스 활성화 방안 도출을 위해 빅데이터 분석방법을 활용하였다. 사용된 빅데이터는 뉴스기사와 특허문헌을 상호 연계하여 활용하고, 뉴스 기사를 통한 동향 분석, 특허문헌 정보를 활용한 기술 분석이 진행 되었다. 본 논문에서는 자율주행에 대한 주요 뉴스에서 토픽모델을 기반으로 한 LDA(Latent Dirichlet Allocation)를 활용하여 빅데이터화 하고 주요 단어를 추출하였다. 특허정보의 주요 단어를 기반으로 적용된 워드넷(WordNet)을 활용하여 공간정보와 연계성 분석, 글로벌 기술 동향 분석을 실시하고 공간정보 분야의 동향 분석 및 예측을 실시하였다. 본 논문에서는 주요뉴스와 특허문헌 정보를 기반으로 한 빅데이터 분석방법으로 자율주행 분야와 공간정보와의 연계성 분석을 통하여 최신 동향과 미래를 예측하는 방법을 제시한다. 빅데이터 분석으로 도출된 자율주행 분야 공간정보의 글로벌 동향은 플랫폼 얼라이언스, 비지니스 파트너쉽, 기업 인수합병, 합작회사 설립, 표준화 및 기술개발로 도출되었다.

Patent Technology Trends of Oral Health: Application of Text Mining

  • Hee-Kyeong Bak;Yong-Hwan Kim;Han-Na Kim
    • 치위생과학회지
    • /
    • 제24권1호
    • /
    • pp.9-21
    • /
    • 2024
  • Background: The purpose of this study was to utilize text network analysis and topic modeling to identify interconnected relationships among keywords present in patent information related to oral health, and subsequently extract latent topics and visualize them. By examining key keywords and specific subjects, this study sought to comprehend the technological trends in oral health-related innovations. Furthermore, it aims to serve as foundational material, suggesting directions for technological advancement in dentistry and dental hygiene. Methods: The data utilized in this study consisted of information registered over a 20-year period until July 31st, 2023, obtained from the patent information retrieval service, KIPRIS. A total of 6,865 patent titles related to keywords, such as "dentistry," "teeth," and "oral health," were collected through the searches. The research tools included a custom-designed program coded specifically for the research objectives based on Python 3.10. This program was used for keyword frequency analysis, semantic network analysis, and implementation of Latent Dirichlet Allocation for topic modeling. Results: Upon analyzing the centrality of connections among the top 50 frequently occurring words, "method," "tooth," and "manufacturing" displayed the highest centrality, while "active ingredient" had the lowest. Regarding topic modeling outcomes, the "implant" topic constituted the largest share at 22.0%, while topics concerning "devices and materials for oral health" and "toothbrushes and oral care" exhibited the lowest proportions at 5.5% each. Conclusion: Technologies concerning methods and implants are continually being researched in patents related to oral health, while there is comparatively less technological development in devices and materials for oral health. This study is expected to be a valuable resource for uncovering potential themes from a large volume of patent titles and suggesting research directions.

빅데이터 분석 도구 R을 활용한 효율적인 특허 검색어 추출에 관한 연구 (A study on the efficient extraction method of patent search key words using big data analysis tool R)

  • 장정환;장청윤;이련;권혁철;이창호
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2013년 추계학술대회
    • /
    • pp.387-391
    • /
    • 2013
  • 디지털 기술의 발달로 세계가 정보 및 지식이 주도하는 사회로 급변하고, 지식 재산권의 발전이 급속하게 진행되면서, 각 기업 및 국가들은 그들의 경쟁력을 키우기 위해 지식재산권에 대한 중요성을 강조하고 있다. 이와 같이 지식재산권의 중요성이 강조되는 현실에서 지식재산권의 확보는 기업의 경쟁력을 좌우하는 요소라 할 수 있다. 따라서 본 논문에서는 빅데이터 분석 도구인 R을 이용하여 빠른 시간 안에 사용자가 목적으로 하고 있는 특허검색 결과를 효율적으로 도출할 수 있는 검색어 추출에 관한 연구를 진행하였다. 이를 위해 다섯 단계의 특허 검색 프로세스를 제안하였고 프로그램으로 구현하여 검색목적에 맞는 특허의 검색에 필요한 시간을 대폭 단축시키면서 목표로 하는 특허 검색을 효율적으로 할 수 있었다.

  • PDF

계층적 주의 네트워크를 활용한 특허 문서 분류 (Patent Document Classification by Using Hierarchical Attention Network)

  • 장현철;한동희;류태선;장형국;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.369-372
    • /
    • 2018
  • 최근 지식경영에 있어 특허를 통한 지식재산권 확보는 기업 운영에 큰 영향을 주는 요소이다. 성공적인 특허 확보를 위해서, 먼저 변화하는 특허 분류 제계를 이해하고, 방대한 특허 정보 데이터를 빠르고 신속하게 특허 분류 체계에 따라 분류화 시킬 필요가 있다. 본 연구에서는 머신 러닝 기술 중에서도 계층적 주의 네트워크를 활용하여 특허 자료의 초록을 학습시켜 분류를 할 수 있는 방법을 제안한다. 그리고 본 연구에서는 제안된 계층적 주의 네트워크의 성능을 검증하기 위해 수정된 입력데이터와 다른 워드 임베딩을 활용하여 진행하였다. 이를 통하여 특허 문서 분류에 활용하려는 계층적 주의 네트워크의 성능과 특허 문서 분류 활용화 방안을 보여주고자 한다. 본 연구의 결과는 많은 기업 지식경영에서 실용적으로 활용할 수 있도록 지식경영 연구자, 기업의 관리자 및 실무자에게 유용한 특허분류기법에 관한 이론적 실무적 활용 방안을 제시한다.

AI Technology Analysis using Partial Least Square Regression

  • Choi, JunHyeog;Jun, Sunghae
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.109-115
    • /
    • 2020
  • 본 논문에서는 부분 최소 제곱(PLS) 회귀 모형을 이용한 인공지능(AI) 기술 분석을 제안한다. AI 기술은 이제 우리 사회의 대부분의 영역에 영향을 미치고 있다. 따라서 이 기술에 대한 정확한 이해가 필요하게 된다. AI 기술을 분석하기 위하여 전 세계 특허 데이터베이스로부터 AI 관련 특허 문서를 수집하고 텍스트 마이닝 기법을 사용하여 수집된 특허 문서에서 AI 기술 키워드를 추출한다. 본 연구에서는 추출된 AI 키워드 데이터를 PLS 회귀 모형으로 분석한다. 바이오정보학, 사회과학 및 공학 등 다양한 분야에서 고급 데이터 분석을 위하여 사용되는 PLS 회귀 모형은 부분 최소 제곱 기법을 기반으로 한다. 제안 방법의 성능을 확인하기 위하여 AI 특허 문서를 사용하여 분석 실험을 수행하고 제안하는 연구가 실제 문제에 어떻게 적용될 수 있는지 보여 준다. 본 논문은 AI 기술뿐만 아니라 다른 기술 분야에도 적용 할 수 있다.

특허문서의 IPC 분류를 위한 데이터 변환 및 통합 (Pre-processing for IPC Classification of Patent Documents)

  • 박수현;김진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.367-368
    • /
    • 2023
  • 4차 산업혁명으로 다양한 기술과 아이디어가 생겨나고 있고, 이를 보호하기 위한 특허는 그 등록 건수가 매년 증가하는 추세이다. 그러나 현재 특허문서를 분류하는 과정을 수동으로 진행하고 있기에 이를 자동으로 진행할 수 있는 분류기를 생성할 필요를 느꼈고, 본 논문에서는 특허문서를 분류기에 적용할 데이터의 전처리 과정 중 데이터 변환과 통합 과정을 다루었다.