• 제목/요약/키워드: 한자처리

검색결과 67건 처리시간 0.022초

CKFont2: 한글 구성요소를 이용한 개선된 퓨샷 한글 폰트 생성 모델 (CKFont2: An Improved Few-Shot Hangul Font Generation Model Based on Hangul Composability)

  • 박장경;;최재영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.499-508
    • /
    • 2022
  • 딥러닝을 이용한 한글 생성 모델에 대한 연구가 많이 진행되었으며, 최근에는 한글 1벌을 생성하기 위하여 입력되는 글자 수를 얼마나 최소화할 수 있는지(Few-Shot Learning)에 대하여 연구되고 있다. 본 논문은 28개 글자를 사용하는 CKFont (이하 CKFont1) 모델을 분석하고 개선하여 14개 글자만을 사용하는 CKFont2 모델을 제안한다. CKFont2 모델은 28글자로 51개 한글 구성요소를 추출하여 모든 한글을 생성하는 CKFont1 모델을, 24개의 구성요소(자음 14개와 모음 10개)를 포함한 14개의 글자만을 이용하여 모든 한글을 생성하는 모델로 성능을 개선하였으며, 이는 현재 알려진 모델로서는 최소한의 글자를 사용한다. 한글의 기본 자/모음으로부터 쌍자음(5), 복자음(11)/복모음(11) 등 27개를 딥러닝으로 학습하여 생성하고, 생성된 27개 구성요소를 24개의 기본 자/모음과 합한 51개 구성요소로부터 모든 한글을 자동 생성한다. zi2zi, CKFont1, MX-Font 모델 생성 결과와 비교 분석하여 성능의 우수성을 입증하였으며, 구조가 간결하고 시간과 자원이 절약되는 효율적인 모델로 한자나 태국어, 일본어에도 확장 적용이 가능하다.

가잠난각의 구조 및 물리화학적 특성에 관한 연구 (Studies on the Structure and Some Physical and Chemical Properties of the Egg Shell in the Silkworm, Bombyx mori L.)

  • 마영일;박광의
    • 한국잠사곤충학회지
    • /
    • 제24권2호
    • /
    • pp.55-72
    • /
    • 1983
  • 가잠의 휴면성을 난각의 조직학적 특성을 보고자 난각층에 대한 전자현미경상을 관찰하였고 또한 난각의 물리화학적 특성에 대해서는 수분투과성, 염산투과성, 염색성 및 난각 구조단백질을 조사한 결과를 요약하면 다음과 같다. 1. 난각구조를 전자현미경으로 보면 뚜렷이 4층으로 되어 있으며, 또한 휴면난과 비휴면난 및 즉침난 사이에 구조적인 차이가 보인다. 즉 외층 밖에 또 다른 전자밀도가 낮은 얇은 층이 휴면난에는 존재하고 있으나 비휴면 및 즉침난에는 이 층을 볼 수 없다. 2. 산난후 20∼24시간째의 휴면난과 비휴면난 및 즉침난 사이에 난각염산투과성의 차이를 보면 휴면난에 비해 즉침난 및 비휴면난이 모두 투과성이 높았고 또한 난령이 지남에 따라 휴면난은 투과성이 떨어지는데 반하여 즉침난 및 비휴면난은 투과성이 높아졌다. 3. 휴면난의 ether 처리난은 무처리난에 비해 난각의 투과성이 변하는 것으로 보아 난각물질 중 ether 용출물이 존재한다. 4. 난각의 수분투과성도 염산투과성에 있어서와 같이 휴면난이 즉침난 및 비휴면난에 비해 수분투과성이 낮았다. 5. 가잠난각의 조직화학적 특성은 단백질과 당에 대한 염색성이 높아 난각에는 단백질과 당이 풍부하며 특히 지질에 대한 염색성은 거의 음성이나 내층으로 갈수록 진하게 염색되었다. 6. 누에의 난각점착물은 PAS-alcian 반응으로 보아 mucopolysaccharides이다. 7. 난각 구조단백질 중 SH단백질에 대한 전기영동상에 있어서 휴면난과 비휴면난 모두 2개의 band가 인정되나 비휴면난의 경우 이동거리가 빠른 band는 매우 흔적적이며 또한 영동거리도 원점으로부터 멀리 이동하여 두 처리간에 minor component에 차이가 보였다. 8. SH단백질에 대한 아미노산조성에 있어서는 휴면난 및 비휴면난 사이에 큰 차이를 인정할 수 없었고 난각단백질중 SH단백질의 구성아미노산에는 glycine이 가장 많고 cystine함량은 적었다. SI K-2 는 Penicillin, Ampicillin과 Cephalothin에 저항성을 나타냈고 ts-U171, A-N92와 A-N115는 이 세항생제에 민감성을 나타냈다. Temperature - sensitive돌연변이균주를 42$^{\circ}C$에서 24시간 배양후에 28$^{\circ}C$로 옮기어 배양한 결과 ts-U601, -U603, -U604와 -U171은 성장을 더 이상하지 않았다.ta-exotoxin을 생산했는데, 48시간 배양 배지 $m\ell$당 70$\mu\textrm{g}$을 분비한 균주는 BTK-1이고, BTK-37 균주는 $m\ell$당 88$\mu\textrm{g}$(6.1$\times$$10^{8}$ Cells/$m\ell$) BTK-35 균주는 $m\ell$당 81$\mu\textrm{g}$(5.2$\times$$10^{8}$ Cells/$m\ell$)을 생산했고. 그외는 모두 70$\mu\textrm{g}$미만이었다. 3. Beta-exotoxin과 B. thuringiensis 균체을 동시에 per os, interaperitoneal injection, subcuntaneous injection, nasal cavity inoculation, intracerebral injection을 120시간 처리했어도 치사효과를 나타내지 않았다.삼각호마법 and Japan#s 병음한자변환방식 have prospect to be prevalent. The following suggestions can be made from these results, 1) All the

  • PDF

낙관 인식을 위한 애플리케이션의 설계 및 구현 (Design and Implementation of Luo-kuan Recognition Application)

  • 김한슬;서귀빈;강민구;류기수;홍민
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.97-103
    • /
    • 2018
  • 대부분의 동양화 작품에는 작가의 정보를 압축시켜 하나의 그림으로 표현한 낙관이 존재하고 이러한 낙관은 작품의 제목이나 작가의 이름 등 다양한 정보를 포함하고 있다. 따라서 동양화를 수집하거나 즐기는 사람들에게 낙관은 동양화에 대한 중요한 정보를 제공하는 단서 역할을 한다. 하지만 낙관에 있는 글자들은 대부분 어려운 한자나 간자 혹은 다양한 모양으로 변형되어 있어 일반인들이 쉽게 해석하기 어려운 문제점이 있다. 본 논문에서는 낙관의 정보를 손쉽게 확인할 수 있도록 안드로이드 기반의 낙관 검색 애플리케이션을 개발하였다. 해당 애플리케이션은 촬영한 낙관 이미지를 분석하여 서버에 전송해 서버 내의 데이터베이스에서 촬영한 낙관 사진과 가장 유사한 낙관 후보에 대한 정보를 검색하는 알고리즘을 적용하였다. 또한 제안하는 알고리즘의 성능 분석을 위해서 촬영된 낙관 사진과 170개의 낙관 데이터 후보 중에서 정확하게 낙관을 찾아내는지에 대한 여부와 제공되는 낙관의 순위를 바탕으로 알고리즘의 정확도를 비교 및 분석하였다. 정확도 분석 실험 결과 본 애플리케이션의 검색 알고리즘의 정확도는 약 90%로 확인되었으며 추후 알고리즘의 최적화와 멀티쓰레딩 알고리즘의 보완을 통해 빅 데이터 환경에서 자동으로 이미지를 분석 및 검색하는 플랫폼으로의 발전이 가능할 것으로 기대한다.

검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델 (A Term Cluster Query Expansion Model Based on Classification Information of Retrieval Documents)

  • 강현수;강현규;박세영;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-12
    • /
    • 1999
  • 정보 검색 시스템은 사용자 질의의 키워드들과 문서들의 유사성(similarity)을 기준으로 관련 문서들을 순서화하여 사용자에게 제공한다. 그렇지만 인터넷 검색에 사용되는 질의는 일반적으로 짧기 때문에 보다 유용한 질의를 만들고자 하는 노력이 지금까지 계속되고 있다. 그러나 키워드에 포함된 정보가 제한적이기 때문에 이에 대한 보완책으로 사용자의 적합성 피드백을 이용하는 방법을 널리 사용하고 있다. 본 논문에서는 일반적인 적합성 피드백의 가장 큰 단점인 빈번한 사용자 참여는 지양하고, 시스템에 기반한 적합성 피드백에서 배제한 사용자 참여를 유도하는 검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델(Term Cluster Query Expansion Model)을 제안한다. 이 방법은 검색 시스템에 의해 검색된 상위 n개의 문서에 대하여 분류기를 이용하여 각각의 문서에 분류 정보를 부여하고, 문서에 부여된 분류 정보를 이용하여 분류 정보의 수(m)만큼으로 문서들을 그룹을 짓는다. 적합성 피드백 알고리즘을 이용하여 m개의 그룹으로부터 각각의 용어 클러스터(Term Cluster)를 생성한다. 이 클러스터가 사용자에게 문서 대신에 피드백의 자료로 제공된다. 실험 결과, 적합성 알고리즘 중 Rocchio방법을 이용할 때 초기 질의보다 나은 성능을 보였지만, 다른 연구에서 보여준 성능 향상은 나타내지 못했다. 그 이유는 분류기의 오류와 문서의 특성상 한 영역으로 규정짓기 어려운 문서가 존재하기 때문이다. 그러나 검색하고자 하는 사용자의 관심 분야나 찾고자 하는 성향이 다르더라도 시스템에 종속되지 않고 유연하게 대처하며 검색 성능(retrieval effectiveness)을 향상시킬 수 있다.사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

웹 상에서의 특정 장르 문서 발견 (Discovery of Genre Information on the Web)

  • 주원균;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.28-35
    • /
    • 1999
  • 정보공유를 목적으로 제안된 웹의 활성화와 함께 유용한 정보들이 웹상에 기하급수적으로 등장함에 따라 정보공간의 확장으로 인한 검색 신뢰도의 저하 문제에 직면하게 되었다. 본 연구에서는 대용량 웹 환경하에서 사용자의 정보발견을 돕기 위해 텍스트이외의 새로운 요소들을 사용하여 특정장르문서를 발견하는 개념을 도입하였다. 먼저 사용자가 발견하고자 하는 장르의 모습을 텍스트, URL정보, 링크 정보. 문서구조 정보 등의 장르 식별요소 값을 이용해 표현한 후, 후보 문서들의 장르관련도를 측정함으로써 특정장르 문서를 검색한다. 각 장르식별요소값은 나름대로의 방법에 의해 계산되는데 $0{\sim}1$사이의 값을 가지며, 종합적인 장르관련도는 각 장르식별요소값의 증거통합 방법에 의해 구한다. 본 논문에서는 각 장르식별요소들의 역할과 장르식별요소가 장르발견에 미치는 영향을 알아보며, 최종적으로 특정 장르 문서발견에 있어서의 검색 신뢰도 향상을 보이기 위해 실험모델을 설계/구현하였다. 본 실험은 웹 문서를 대상으로 하는데, 아직까지 URL, 링크 정보를 모두 갖춘 테스트컬렉션이 없기 때문에 실험을 위해 일반적인 웹 문서로 직접 구성한 컬렉션을 사용하였다. 발견하고자 하는 장르는 "컴퓨터 분야의 컨퍼런스 홈페이지"로 정하였으며 30개의 컴퓨터 분야를 선정하였다. 비교대상으로는 일반 웹 검색 엔진인 알타비스타와 메타검색 엔진인 메타크롤러를 선택하였고. 각 질의에 대해 상위 30개의 결과를 대상으로 정확도를 평가하였다. 결과로서 각 장르식별요소들은 모두 검색 신뢰도의 향상에 기여를 하며, 제안하는 방법은 알타비스타와 메타크롤러에 비해 각각 평균적으로 67.34%, 71.78%의 검색 신뢰도 향상을 보임을 입증하였다.적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract 농도(濃度)가 증가(增加)함

  • PDF

한국산 간버섯의 인공재배 및 항산화 활성 평가 (Artificial Cultivation and Antioxidant Activity of Korean Native Mushroom Pycnoporus coccineus)

  • 이용국;김민경;윤봉식;서건식
    • 현장농수산연구지
    • /
    • 제21권2호
    • /
    • pp.35-47
    • /
    • 2019
  • 간버섯 균주의 균사 생장은 PDA와 YMA에서 균사의 밀도와 생장량이 양호하였으나, MEA에서는 균사 생장량과 속도가 저조하였다. 배양 기간 중 광(光)조사는 균사체의 색소 형성과 균사체 밀도에 영향을 주었다. 간버섯은 병 재배와 봉지 재배 모두에서 자실체를 발생시킬 수 있었고 종균 배양과 재배를 위한 가장 적합한 배지 원료는 참나무톱밥으로 밝혀졌다. 톱밥배지를 사용한 인공재배에서 자실체의 발생은 15일째부터 육안으로 확인할 수 있는 정도로 자실체 원기가 생장하였으며 상대습도가 낮은 처리구에서 5일 정도 빠르게 형성되었다. 버섯 발생 40~45일째에는 성숙한자실체를 수확할 수 있었고, 생육실의 상대습도가 낮은 편이 버섯 발생과 생육에 유리하였다. 인공재배에서 수확한 자실체의 항산화 활성을 조사한 결과, 간버섯의 ABTS radical 소거 활성은 병 재배 자실체 추출물과 야생 간버섯 자실체 methanol 추출물이 각각 505㎍/㎖, 515㎍/㎖의 농도로 낮은 활성을 나타내었으나 봉지 재배에서 수확한 자실체는 910㎍/㎖로 높게 나타났다. DPPH radical 소거 활성 결과 모든 추출물이 활성 2,000㎍/㎖ 농도 이상의 IC50값으로 활성을 나타내지 않았다. 간버섯의 ethyl acetate 추출물의 경우 간버섯 병 재배 자실체 추출물이 IC50값 154.5㎍/㎖으로 가장 높은 활성을 보이는 것으로 나타났으며, 간버섯 methanol 추출물은 동일 농도(10mg/㎖)에서 ABTS radical 소거 활성은 야생 간버섯 자실체 추출물이 가장 높은 활성을 보였다.

수정된 Neocognitron을 사용한 필기체 한글인식 (Study on the Neural Network for Handwritten Hangul Syllabic Character Recognition)

  • 김은진;백종현
    • 인지과학
    • /
    • 제3권1호
    • /
    • pp.61-78
    • /
    • 1991
  • 본 논문은 역행 통로(backward path)를 가진 수정된 Neocognitron 을 한글 음절 인식을 위해 적용한 결과에 관한 것이다. Fukushima의 논문에서 Neocognitron이 $19{\times}19$ 크기의 필기체 숫자를 인식할 수있다고 논술하였다. 본 논문에서는 스캐너 또는 마우스를 이용하여 필기체 한글 문자 또는 그 일부의 $61{\times}61$ 영상을 입력하였다. 수정된 Neocognitron은 3쌍의 Us, Uc층으로 구성되어있다. 본 신경회로망에서 마지막 인식층인 Uc층은 $5{\times}5$ 크기의 세포로 된 24개의 명(plane)으로 구성되어 있는데, 각각의 세포들은 동시에 주의력(attention)을 받아들이느 자소(grapheme)의 존재와 입력층에서의 상대적 위치를 구별할 수 있다. 본 신경회로망은 10개의 단모음 자소, 14개의 단자음 자소와 그들의 공간적 특징을 가지고 학습시켰다. 쉽게 학습되지 않는 패턴들은 여러번 학습시켰다. 왜곡, 잡음, 크기변화, 변형, 회전 등을 갖는 개개의 자소를 분류할 수 있도록 학습된 신경망을 한글 음절의 인식을 위해 사용하였으며, 음절자내의 영상 분할 작업을 위해 선택적 주의력 기법을 사용하였다. 입력문자에 대한 초기 표본 실험에서 본 모형은 필기체 한글 음절자의 시험패턴중 79%를 정확하게 인식하였다. 이 연구결과는 Neocognitron이 입력 영상을 인식가능한 부분으로 분할함으로써 큰크기의 분자 집합을 갖는 필기체 문자를 인식할수 있는 강력한 모형임을 시사해준다. 똑같은 접근 방법이 구조나 자소가 아주 복잡한 한자의 인식에도 적용될 수 있다고 본다. 그러나, 모의실험에서 처리시간에 있어 매우 심한 병목현상을 보여 주었다. 모형의 실질적인 사용을 위해서는 신경칩으로서의 구현이 선결되어야 할 것이다. 또, 복모음, 복자음으로 구성된 한글 음절자 인식을 위하여 모형에 대한 더 깊은 연구가 수행되어질 필요가 있다. 두개의 단자모사이의 이웃지역을 정확히 인식하는 것은 이렇나 작업을 위해 매우 중요한 일이 될 것이다.