• 제목/요약/키워드: Bert

검색결과 390건 처리시간 0.024초

스테비아 잎차의 제조 방법에 따른 품질 특성 (The Quality Characteristics of Stevia (Stevia rebaudiana Bert) Leaf Tea according to Different Manufacturing Processes)

  • 이웅수;김근식;최원석
    • 한국식품영양학회지
    • /
    • 제27권2호
    • /
    • pp.156-163
    • /
    • 2014
  • In order to develop tea by using the leaves of stevia, which is a herbal plant, and to solve the disadvantages of stevia dried leaf tea, we have manufactured the steamed tea, stir-fried tea and fermented tea by changing the manufacturing processes. As a result of the sensory tests, the steamed tea, stir-fried tea and fermented tea received higher evaluations than the dried leaf tea. In terms of efficiency, it is desired that the total number of steaming and stir-frying is only once, but the fermentation is found to be the most desirable for 2 days. There are no trends for changes in the general ingredients, mineral and free amino acid contents of stevia leaf teas by different manufacturing processes. As a result for the measurement of antioxidant activities, the steamed tea and dried leaf tea did not show significant differences, but the stir-fried tea and the fermented tea show significantly low antioxidant activities as compared to the steamed tea. The contents of stevioside in both the stir-fried tea and the fermented tea were less than that in the dried leaf tea, but in the steamed tea, there was no significant difference in the content of stevioside. Base on the present observations, this study supports high potentials of steaming process in order to produce new stevia leaf tea.

Structural monitoring of wind turbines using wireless sensor networks

  • Swartz, R. Andrew;Lynch, Jerome P.;Zerbst, Stephan;Sweetman, Bert;Rolfes, Raimund
    • Smart Structures and Systems
    • /
    • 제6권3호
    • /
    • pp.183-196
    • /
    • 2010
  • Monitoring and economical design of alternative energy generators such as wind turbines is becoming increasingly critical; however acquisition of the dynamic output data can be a time-consuming and costly process. In recent years, low-cost wireless sensors have emerged as an enabling technology for structural monitoring applications. In this study, wireless sensor networks are installed in three operational turbines in order to demonstrate their efficacy in this unique operational environment. The objectives of the first installation are to verify that vibrational (acceleration) data can be collected and transmitted within a turbine tower and that it is comparable to data collected using a traditional tethered system. In the second instrumentation, the wireless network includes strain gauges at the base of the structure. Also, data is collected regarding the performance of the wireless communication channels within the tower. In both turbines, collected wireless sensor data is used for off-line, output-only modal analysis of the ambiently (wind) excited turbine towers. The final installation is on a turbine with embedded braking capabilities within the nacelle to generate an "impulse-like" load at the top of the tower. This ability to apply such a load improves the modal analysis results obtained in cases where ambient excitation fails to be sufficiently broad-band or white. The improved loading allows for computation of true mode shapes, a necessary precursor to many conditional monitoring techniques.

설명 가능한 개인화 영화 추천 서비스를 위한 딥러닝 기반 텍스트 요약 모델 (Deep Learning-based Text Summarization Model for Explainable Personalized Movie Recommendation Service)

  • 진요요;강경모;김재경
    • 한국IT서비스학회지
    • /
    • 제21권2호
    • /
    • pp.109-126
    • /
    • 2022
  • The number and variety of products and services offered by companies have increased dramatically, providing customers with more choices to meet their needs. As a solution to this information overload problem, the provision of tailored services to individuals has become increasingly important, and the personalized recommender systems have been widely studied and used in both academia and industry. Existing recommender systems face important problems in practical applications. The most important problem is that it cannot clearly explain why it recommends these products. In recent years, some researchers have found that the explanation of recommender systems may be very useful. As a result, users are generally increasing conversion rates, satisfaction, and trust in the recommender system if it is explained why those particular items are recommended. Therefore, this study presents a methodology of providing an explanatory function of a recommender system using a review text left by a user. The basic idea is not to use all of the user's reviews, but to provide them in a summarized form using only reviews left by similar users or neighbors involved in recommending the item as an explanation when providing the recommended item to the user. To achieve this research goal, this study aims to provide a product recommendation list using user-based collaborative filtering techniques, combine reviews left by neighboring users with each product to build a model that combines text summary methods among deep learning-based natural language processing methods. Using the IMDb movie database, text reviews of all target user neighbors' movies are collected and summarized to present descriptions of recommended movies. There are several text summary methods, but this study aims to evaluate whether the review summary is well performed by training the Sequence-to-sequence+attention model, which is a representative generation summary method, and the BertSum model, which is an extraction summary model.

인공지능 윤리 인식에 대한 데이터 분석 및 시각화 연구 -대화형 인공지능 서비스 '이루다'를 중심으로- (A Data Analysis and Visualization of AI Ethics -Focusing on the interactive AI service 'Lee Luda'-)

  • 이수련;최은정
    • 디지털융복합연구
    • /
    • 제20권2호
    • /
    • pp.269-275
    • /
    • 2022
  • 사람을 대상으로 하는 인공지능 서비스가 증가하면서 인공지능에서도 윤리적 토대 위에서 이루어져야 한다는 사회적 요구가 증가하고 있다. 이러한 흐름에 따라 정부와 기업에서는 인공지능 윤리와 관련된 정책, 규범 등을 마련하고 있다. 합리적인 정책, 규범을 마련하기 위해서는 대중들이 가지고 있는 인식을 파악하는 것이 첫 번째 단계이다. 본 논문에서는 인공지능과 윤리에 대한 대중들의 인식을 파악하기 위해 소셜데이터와 뉴스 댓글을 수집하고 관심도 분석, 감성 분석, 담론 분석 수행 후 시각화하였다. 분석 결과, "인공지능 윤리"에 대한 관심도와 '인공지능" 호감도는 반비례하는 상관관계를 보여주었다. 담론분석 결과로, 가장 큰 이슈가 "개인정보 유출"이었고 학습 데이터의 오염 및 편향 문제와 컴퓨터로 만들어진 인공지능에게 법인격을 부여해야 하는지에 대한 담론도 보여주었다. 본 연구가 인공지능 윤리 규범, 정책을 마련할 때 대중들의 인식을 파악할 수 있는 자료로 활용될 수 있을 것이다.

흐름이 있는 문서에 적합한 비지도학습 추상 요약 방법 (Unsupervised Abstractive Summarization Method that Suitable for Documents with Flows)

  • 이훈석;안순홍;김승훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.501-512
    • /
    • 2021
  • 최근 Encoder-Decoder를 기반한 요약은 거의 인간 수준에 도달하였다. 하지만 이는 영어, 중국어 등 수백만 건의 데이터세트가 잘 갖추어진 주류 언어권에서만 활용 가능하며 데이터세트가 구축되지 않은 비주류 언어권에서는 활용하지 못하는 한계가 있다. 또한, 문서의 일부 영역에 초점 하여 요약하는 편향의 문제를 갖고 있어 동화나 소설과 같이 흐름이 있는 문서에는 적합하지 않다. 본 논문에서는 두 개의 Discriminator가 있는 GAN을 통해 비지도 학습 기반의 추상 요약을 하며, 가이드 토큰의 추출과 주입을 통해 편향 문제를 개선하는 추출 요약과 추상 요약을 혼합한 하이브리드 요약 방법을 제안한다. CNN/Daily Mail 데이터세트를 통해 모델을 평가하여 객관적인 타당성을 검증하고 비주류 언어 중 하나인 한국어에서도 유효한 성능을 보인다는 것을 입증한다.

An Application of RASA Technology to Design an AI Virtual Assistant: A Case of Learning Finance and Banking Terms in Vietnamese

  • PHAM, Thi My Ni;PHAM, Thi Ngoc Thao;NGUYEN, Ha Phuong Truc;LY, Bao Tuyen;NGUYEN, Truc Linh;LE, Hoanh Su
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제9권5호
    • /
    • pp.273-283
    • /
    • 2022
  • Banking and finance is a broad term that incorporates a variety of smaller, more specialized subjects such as corporate finance, tax finance, and insurance finance. A virtual assistant that assists users in searching for information about banking and finance terms might be an extremely beneficial tool for users. In this study, we explored the process of searching for information, seeking opportunities, and developing a virtual assistant in the first stages of starting learning and understanding Vietnamese to increase effectiveness and save time, which is also an innovative business practice in Use-case Vietnam. We built the FIBA2020 dataset and proposed a pipeline that used Natural Language Processing (NLP) inclusive of Natural Language Understanding (NLU) algorithms to build chatbot applications. The open-source framework RASA is used to implement the system in our study. We aim to improve our model performance by replacing parts of RASA's default tokenizers with Vietnamese tokenizers and experimenting with various language models. The best accuracy we achieved is 86.48% and 70.04% in the ideal condition and worst condition, respectively. Finally, we put our findings into practice by creating an Android virtual assistant application using the model trained using Whitespace tokenizer and the pre-trained language m-BERT.

한국어 기계 독해를 위한 언어 모델의 효과적 토큰화 방법 탐구 (Exploration on Tokenization Method of Language Model for Korean Machine Reading Comprehension)

  • 이강욱;이해준;김재원;윤희원;유원호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.197-202
    • /
    • 2019
  • 토큰화는 입력 텍스트를 더 작은 단위의 텍스트로 분절하는 과정으로 주로 기계 학습 과정의 효율화를 위해 수행되는 전처리 작업이다. 현재까지 자연어 처리 분야 과업에 적용하기 위해 다양한 토큰화 방법이 제안되어 왔으나, 주로 텍스트를 효율적으로 분절하는데 초점을 맞춘 연구만이 이루어져 왔을 뿐, 한국어 데이터를 대상으로 최신 기계 학습 기법을 적용하고자 할 때 적합한 토큰화 방법이 무엇일지 탐구 해보기 위한 연구는 거의 이루어지지 않았다. 본 논문에서는 한국어 데이터를 대상으로 최신 기계 학습 기법인 전이 학습 기반의 자연어 처리 방법론을 적용하는데 있어 가장 적합한 토큰화 방법이 무엇인지 알아보기 위한 탐구 연구를 진행했다. 실험을 위해서는 대표적인 전이 학습 모형이면서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 최종 성능 비교를 위해 토큰화 방법에 따라 성능이 크게 좌우되는 과업 중 하나인 기계 독해 과업을 채택했다. 비교 실험을 위한 토큰화 방법으로는 통상적으로 사용되는 음절, 어절, 형태소 단위뿐만 아니라 최근 각광을 받고 있는 토큰화 방식인 Byte Pair Encoding (BPE)를 채택했으며, 이와 더불어 새로운 토큰화 방법인 형태소 분절 단위 위에 BPE를 적용하는 혼합 토큰화 방법을 제안 한 뒤 성능 비교를 실시했다. 실험 결과, 어휘집 축소 효과 및 언어 모델의 퍼플렉시티 관점에서는 음절 단위 토큰화가 우수한 성능을 보였으나, 토큰 자체의 의미 내포 능력이 중요한 기계 독해 과업의 경우 형태소 단위의 토큰화가 우수한 성능을 보임을 확인할 수 있었다. 또한, BPE 토큰화가 종합적으로 우수한 성능을 보이는 가운데, 본 연구에서 새로이 제안한 형태소 분절과 BPE를 동시에 이용하는 혼합 토큰화 방법이 가장 우수한 성능을 보임을 확인할 수 있었다.

  • PDF

딥러닝 기반 사전학습 언어모델에 대한 이해와 현황 (A Survey on Deep Learning-based Pre-Trained Language Models)

  • 박상언
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.11-29
    • /
    • 2022
  • 사전학습 언어모델은 자연어 처리 작업에서 가장 중요하고 많이 활용되는 도구로, 대량의 말뭉치를 대상으로 사전학습이 되어있어 적은 수의 데이터를 이용한 미세조정학습으로도 높은 성능을 기대할 수 있으며, 사전학습된 토크나이저과 딥러닝 모형 등 구현에 필요한 요소들이 함께 배포되기 때문에 자연어 처리 작업에 소요되는 비용과 기간을 크게 단축시켰다. 트랜스포머 변형 모형은 이와 같은 장점을 제공하는 사전학습 언어모델 중에서 최근 가장 많이 사용되고 있는 모형으로, 번역을 비롯하여 문서 요약, 챗봇과 같은 질의 응답, 자연스러운 문장의 생성 및 문서의 분류 등 다양한 자연어 처리 작업에 활용되고 있으며 컴퓨터 비전 분야와 오디오 관련 분야 등 다른 분야에서도 활발하게 활용되고 있다. 본 논문은 연구자들이 보다 쉽게 사전학습 언어모델에 대해 이해하고 자연어 처리 작업에 활용할 수 있도록 하기 위해, 언어모델과 사전학습 언어모델의 정의로부터 시작하여 사전학습 언어모델의 발전과정과 다양한 트랜스포머 변형 모형에 대해 조사하고 정리하였다.

Long-Term Wildfire Reconstruction: In Need of Focused and Dedicated Pre-Planning Efforts

  • Harris, William S.;Choi, Jin Ouk;Lim, Jaewon;Lee, Yong-Cheol
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.923-928
    • /
    • 2022
  • Wildfire disasters in the United States impact lives and livelihoods by destroying private homes, businesses, community facilities, and infrastructure. Disaster victims suffer from damaged houses, inadequate shelters, inoperable civil infrastructure, and homelessness coupled with long-term recovery and reconstruction processes. Cities and their neighboring communities require an enormous commitment for a full recovery for as long as disaster recovery processes last. State, county, and municipal governments inherently have the responsibility to establish and provide governance and public services for the benefit and well being of community members. Municipal governments' comprehensive and emergency response plans are the artifacts of planning efforts that guide accomplishing those duties. Typically these plans include preparation and response to natural disasters, including wildfires. The standard wildfire planning includes and outlines (1) a wildfire hazard assessment, (2) response approaches to prevent human injury and minimize damage to physical property, and (3) near- and long-term recovery and reconstruction efforts. There is often a high level of detail in the assessment section, but the level of detail and specificity significantly lessons to general approaches in the long-term recovery subsection. This paper aims to document the extent of wildfire preparedness at the county level in general, focusing on the long-term recovery subsections of municipal plans. Based on the identified challenges, the researchers provide recommendations for better longer-term recovery and reconstruction opportunities: 1) building permit requirements, 2) exploration of the use of modular construction, 3) address through relief from legislative requirements, and 4) early, simple, funding, and the aid application process.

  • PDF

긴급재난 대응용 5G 이동 기지국을 위한 대기공간 광통신 장치의 제작과 특성평가 (Manufacturing and Characteristic Evaluation of Free space Optical Communication Devices in 5G Mobile Base Stations for Emergency Disaster Response)

  • 장진현
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.131-138
    • /
    • 2023
  • 본 논문에서는 수 km이하의 이동 기지국에 활용할 수 있는 대기공간 광통신(Free Space Optic) 장치를 제작하고 그 특성을 알아보았다. 대기전송으로 인한 손실을 극복하고자 23dBm 이상의 출력을 갖는 광섬유증폭기(EDFA)를 사용하였다. 레이저 빔의 집속도를 높이고 소형화하기 위하여 광학렌즈를 제작하였으며, 1.5 ~1.8[mrad] 범위내에서 빔 발산각(divergence)을 갖도록 송신렌즈를 설계하였다. 송수신부의 장비간의 효과적인 자동정렬과 포인팅 에러를 줄이기 위하여 PAN/TILT를 제어하는 PT 모듈을 제작하였다. 본 연구에서는 일정한 수준이상으로 전송품질을 유지하기 위하여 Reed-Solomon(RS) 코드를 사용하였다. 가시도 300m의 기후 상황에서 300m 대기공간 거리를 통신이 가능하도록 제작하였다. 성능측정을 위하여 비트에러 측정기와 아이패턴 분석기를 이용하여 측정하였으며 2.5Gbps 이상에서 10-9 BER을 유지할 수 있음을 확인할 수 있었다.