• 제목/요약/키워드: Vocabulary knowledge

검색결과 98건 처리시간 0.022초

Registry Metadata Quality Assessment by the Example of re3data.org Schema

  • Kim, Suntae;Choi, Myung-Seok
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제7권2호
    • /
    • pp.41-51
    • /
    • 2017
  • Nowadays, research data repositories (RDR) have become progressively widespread all over the world. To expand repository services and build up inbound linking strategy, organizations list their repositories with so called Global Registries. Accordingly, such registries should be carefully described by the related data. In this study, I explore the metadata schema of re3data.org. I collect and analyze descriptions from the listed repositories, and come up with some suggestions concerning possible improvements to the metadata schema. To accomplish this, I develop a crawler program, which collects necessary data from the re3data.org. Based on the analysis results, I have identified two issues that required elements is missing, one issue that required element value is missing when the corresponding property is applied, five inconsistency issues with re3data controlled vocabulary, six issues with undescribed optional elements, and two inconsistency issues between the elements and their attributes which do not pair with. I believe this discussion can facilitate improvements to the existing re3data.org schema and further help researchers who analyze data repository trends.

Survey of Automatic Query Expansion for Arabic Text Retrieval

  • Farhan, Yasir Hadi;Noah, Shahrul Azman Mohd;Mohd, Masnizah
    • Journal of Information Science Theory and Practice
    • /
    • 제8권4호
    • /
    • pp.67-86
    • /
    • 2020
  • Information need has been one of the main motivations for a person using a search engine. Queries can represent very different information needs. Ironically, a query can be a poor representation of the information need because the user can find it difficult to express the information need. Query Expansion (QE) is being popularly used to address this limitation. While QE can be considered as a language-independent technique, recent findings have shown that in certain cases, language plays an important role. Arabic is a language with a particularly large vocabulary rich in words with synonymous shades of meaning and has high morphological complexity. This paper, therefore, provides a review on QE for Arabic information retrieval, the intention being to identify the recent state-of-the-art of this burgeoning area. In this review, we primarily discuss statistical QE approaches that include document analysis, search, browse log analyses, and web knowledge analyses, in addition to the semantic QE approaches, which use semantic knowledge structures to extract meaningful word relationships. Finally, our conclusion is that QE regarding the Arabic language is subjected to additional investigation and research due to the intricate nature of this language.

Using Small Corpora of Critiques to Set Pedagogical Goals in First Year ESP Business English

  • Wang, Yu-Chi;Davis, Richard Hill
    • 아시아태평양코퍼스연구
    • /
    • 제2권2호
    • /
    • pp.17-29
    • /
    • 2021
  • The current study explores small corpora of critiques written by Chinese and non-Chinese university students and how strategies used by these writers compare with high-rated L1 students. Data collection includes three small corpora of student writing; 20 student critiques in 2017, 23 student critiques from 2018, and 23 critiques from the online Michigan MICUSP collection at the University of Michigan. The researchers employ Text Inspector and Lexical Complexity to identify university students' vocabulary knowledge and awareness of syntactic complexity. In addition, WMatrix4® is used to identify and support the comparison of lexical and semantic differences among the three corpora. The findings indicate that gaps between Chinese and non-Chinese writers in the same university classes exist in students' knowledge of grammatical features and interactional metadiscourse. In addition, critiques by Chinese writers are more likely to produce shorter clauses and sentences. In addition, the mean value of complex nominal and coordinate phrases is smaller for Chinese students than for non-Chinese and MICUSP writers. Finally, in terms of lexical bundles, Chinese student writers prefer clausal bundles instead of phrasal bundles, which, according to previous studies, are more often found in texts of skilled writers. The current study's findings suggest incorporating implicit and explicit instruction through the implementation of corpora in language classrooms to advance skills and strategies of all, but particularly of Chinese writers of English.

음운인식의 언어 간 전이와 한글 및 영어의 읽기 쓰기와의 관계 (Cross-language Transfer of Phonological Awareness and Its Relations with Reading and Writing in Korean and English)

  • 김상미;조증열;김지연
    • 인지과학
    • /
    • 제26권2호
    • /
    • pp.125-146
    • /
    • 2015
  • 본 연구는 초등학교 5학년 학생들을 대상으로 한국어 음운인식이 영어 음운인식에 기여하는지의 여부와, 한국어와 영어의 음운인식이 한글과 영어 읽기 및 쓰기와 관련이 되는지를 살펴보았다. 그 결과, 어휘력과 연령을 통제한 후에 한국어 음운인식은 영어 음운인식의 변량을 유의하게 설명하였다. 구체적으로 한국어 음절과 음소인식은 영어 음절인식을 예측하였고, 한국어 음소인식은 영어 음소인식을 예측하였다. 연령과 어휘력을 통제한 후에 영어 음소인식은 영어와 한글의 읽기와 받아쓰기의 변량을 유의하게 설명하였다. 또한 한국어 음절인식이 한글읽기를 설명하였으며, 영어 음절인식은 한글 받아쓰기를 설명하였다. 본 연구의 결과는 음운인식은 상위언어적 기술(metalinguistic skill)로 한국어에서 영어로 언어 간 전이되는 것을 시사한다. 또한 음소인식이 영어의 읽기와 쓰기에 중요하지만, 음소와 음절인식이 한글의 읽기와 쓰기에 중요한 것을 시사한다.

이야기책을 통한 취학 전 아동의 어휘력 발달에 관한 연구 : 개인차에 따른 교사 읽기 방법의 차별적 영향을 중심으로 (Vocabulary Learning from Storybooks : Effects of a Teacher's Reading Strategy on Korean Preschoolers with Different Prior Word Knowledge)

  • 한은혜
    • 아동학회지
    • /
    • 제22권1호
    • /
    • pp.251-271
    • /
    • 2001
  • 교사가 이야기책을 반복하여 읽어주는 (a multiple reading) 과정에서 아동이 새로운 단어에 해당하는 그림을 보고 그 단어를 명명하게 하는 (a labeling strategy) 읽기 방법이 아동의 어휘획득에 연령과 경험에 따라 차별적인 효과를 가져오는가, 또한 동일한 읽기 방법이 그룹 상황에 적용되었을 때 일대일 상황에서 얻어지는 효과와 같은 효율성을 갖는가의 문제가 각각의 실험에서 다루어졌다. 양 실험에서 각 연령 (4, 5세) 집단은 그림 어휘력 검사의 표준 점수 결과를 기준으로 하여, 상 하 두 어휘력 집단으로 나뉘어졌다. 아동이 설정된 새로운 단어를 획득한 결과는 comprehensive와 productive 어휘력 검사를 통해 측정되었다. 첫 번째 실험에서 4세와 5세 아동들은 각 연령 집단에서 교사가 일 대 일로 이야기책을 읽어줄 때, 수동적으로 듣거나 또는 설정된 단어에 해당하는 그림을 보며 직접 명명할 수 있었다. 두 번째 실험에서는 첫 번째 실험에 참여한 4세 아동들이 같은 읽기 방법으로 그룹 상황에서 읽혀졌다. 첫 번째 실험 결과, 새로운 단어를 comprehend 하고 produce 하는데 5세 아동이 4세 아동 보다 나은 기제를 갖고 있는지는 분명히 밝혀지지 않았다. 결과를 통해 분명하게 밝혀진 것은 이야기책이 읽혀지는 동안 얻어지는 comprehensive 어휘와 productive 어휘에는 차이가 있다는 것이다. 아동들은, 특히 어릴수록, 새로운 단어를 comprehend 하는데 있어서는 labeling strategy의 효과를 보지 못한 반면, 단어를 produce 하는데 있어서는 동일한 방법이 단순한 반복 읽기 보다 효과적이었다. 덧붙여, 어휘력에 있어 상위 집단에 속한 아동이 하위 집단에 속한 아동 보다 더 많은 단어를 comprehend 하고 produce 한다는 점을 확인시켰다. 두 번째 실험 결과는 그룹 상황에서 4세 아동에게 이야기책을 읽어줌으로써 새로운 단어를 획득하게 할 수 있다는 것을 보여 주었다. 사용된 labeling strategy는 특히 productive 어휘 획득에 효과적인 것으로 나타났으며, 따라서 일대일 상황에서 뿐 아니라 그룹 상황에서도 중요한 요소로 보였다. 덧붙여, productive 어휘 획득에 있어서 labeling strategy의 효과는 어휘력에 있어 하위 집단에 속한 아동에게는 상황에 따라 다른 결과를 가져왔다. 즉, labeling strategy의 효과에 있어서 하위 집단의 아동들은 그룹보다 일대일 상황에서 productive 어휘를 더 많이 획득했다. 연구결과, productive 어휘력 발달을 위하여 교사는 일대일 책읽기 뿐 아니라 그룹 책 읽기에서도 labeling strategy를 사용하는 것을 고려해야 하며, 비교적 적은 어휘력을 갖고 있는 아동에게는 일대일 상황에서 labeling strategy를 사용하여 이야기책을 읽어주는 시간을 할당할 것을 제시했다.

  • PDF

시간영역에서의 파형분석에 의한 무제한 어휘 합성 및 음절 유형별 규칙합성음 음질평가 (Speech Synthesis for the Korean large Vocabulary Through the Waveform Analysis in Time Domains and Evauation of Synthesized Speech Quality)

  • 강찬희;진용옥
    • 한국음향학회지
    • /
    • 제13권1호
    • /
    • pp.71-83
    • /
    • 1994
  • 본 논문은 한국어 문어면환(TTS : Text-to-Speech) 시스템내에서의 음성합성시 음질 및 자연성 개선을 위한 연구 결과이다. 합성방법으로는 단음절단위의 파형을 시간영역에서 분석(표1)하여 규칙합성에 필요한 매개변수(표2)를 추출하여 규칙합성시켰다. 실험에 사용된 음절은 한국어 발음 대사전의 빈도순위에 따라 V형 19개, CV형 80개, VC형 30개, CVC형 100개등 총 229음절을 선정하여 규칙합성시켰다. 규칙합성음의 평가방법으로는 229개의 규칙합성음중 음절 유형별로 15개씩 무작위로 추출한 합성음을 사전지식이 없는 임의의 그룹을 선정하여 이해도, 명료도, 잡음감, 자연성등 4가지 항목에 대하여 주관적인 오피니온 평가를 수행하였다. 실험결과, 합성음의 음질은 대단히 명료한 수준이었으며, 운율요소의 제어결과는 지속시간(장단)과 악센트(강약)의 제어(그림 9, 그림 10)가 가능하였으며, 피치주기(억양)의 제어도 Lagrange 보간법을 사용함으로써 가능하였다(그림 11, 그림 12).

  • PDF

대어휘 연속음성 인식을 위한 결합형태소 자동생성 (Automatic Generation of Concatenate Morphemes for Korean LVCSR)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.407-414
    • /
    • 2002
  • 본 논문에서는 형태소를 인식 단위로 하는 한국어 연속음성 인식의 성능 개선을 위해 결합형태소를 자동으로 생성하는 방법을 제시한다. 학습코퍼스의 54%를 차지하고 오인식의 주요인이 되는 단음절 형태소를 감소시켜서 인식 성능을 높이는 것을 목적으로 한다. 품사의 접속 규칙을 이용한 기존의 지식기반의 형태소 결합방법은 접속 규칙의 생성이 어렵고, 학습 코퍼스에 나타난 출현 빈도를 반영하지 못하여 저빈도 결합형태소를 다수 생성하는 경향을 보였다. 본 논문에서 제시하는 방법은 학습데이터의 통계정보를 이용하여 결합형태소를 자동 생성한다. 결합할 형태소 쌍 선정을 위한 평가척도로는 형태소 쌍의 빈도, 상호정보, 유니그램 로그 유도값(unigram log likelihood)을 이용하였고 여기에 한국어의 특성 반영을 위해 단음절 형태소 제약과 형태소 결합길이를 제한하는 두개의 제약사항을 추가하였다. 학습에 사용된 텍스트 코퍼스는 방송뉴스와 신문으로 구성된 7백만 형태소이고, 최빈도 2만 형태소 다중 발음사전을 사용하였다. 세가지 평가척도 중 빈도를 이용한 것의 성능이 가장 좋았고 여기에 제약조건을 반영하여 성능을 더 개선할 수 있었다. 특히 최대 결합 길이를 3으로 할 때의 성능이 가장 우수하여 언어모델 혼잡도는 117.9에서 97.3으로 18%감소했으며, 형태소 에러율 (MER: Morpheme error rate)은 21.3%에서 17.6%로 감소하였다. 이때 단음절 형태소는 54%에서 30%로 24%가 감소하였다.

텍스트마이닝을 위한 패션 속성 분류체계 및 말뭉치 웹사전 구축 (Development of Online Fashion Thesaurus and Taxonomy for Text Mining)

  • 장세윤;김하연;김송미;최우진;정진;이유리
    • 한국의류학회지
    • /
    • 제46권6호
    • /
    • pp.1142-1160
    • /
    • 2022
  • Text data plays a significant role in understanding and analyzing trends in consumer, business, and social sectors. For text analysis, there must be a corpus that reflects specific domain knowledge. However, in the field of fashion, the professional corpus is insufficient. This study aims to develop a taxonomy and thesaurus that considers the specialty of fashion products. To this end, about 100,000 fashion vocabulary terms were collected by crawling text data from WSGN, Pantone, and online platforms; text subsequently was extracted through preprocessing with Python. The taxonomy was composed of items, silhouettes, details, styles, colors, textiles, and patterns/prints, which are seven attributes of clothes. The corpus was completed through processing synonyms of terms from fashion books such as dictionaries. Finally, 10,294 vocabulary words, including 1,956 standard Korean words, were classified in the taxonomy. All data was then developed into a web dictionary system. Quantitative and qualitative performance tests of the results were conducted through expert reviews. The performance of the thesaurus also was verified by comparing the results of text mining analysis through the previously developed corpus. This study contributes to achieving a text data standard and enables meaningful results of text mining analysis in the fashion field.

The Beliefs about Language Learning of Korean College Students and Their Teachers of English

  • Kim, Kyung-Ja
    • 영어어문교육
    • /
    • 제12권3호
    • /
    • pp.1-24
    • /
    • 2006
  • This study investigated differences in beliefs about English learning of 286 EFL college students and 52 English teachers in Korea. Data was collected using Horwitz's Beliefs About Language Learning Inventory and compared between students and teachers in beliefs. To address the research questions, the data were analyzed through descriptive statistics including frequencies, factor analysis, MANOVA, ANOVA, t-test, and reliability coefficients. The results showed four factors in student beliefs: Difficulty of learning English, nature of learning English, importance of correctness in learning English, and motivation and perceived importance of learning English. Clear differences were found in students and teachers' beliefs in English learning aptitude and importance of translation, error correction, and grammar rules. A few belief differences were also identified between Koreans and native-speaking English teachers related to the importance of vocabulary learning, pronunciation, and cultural knowledge. The findings of the study indicated that background variables such as gender and major field of study have an effect on student beliefs about L2 learning. The present study also provided pedagogical considerations to reduce mismatch between students and teachers beliefs and to improve the L2 planning and instruction.

  • PDF

상호작용 읽기전략을 통해서 본 한국 대학생들의 독해과정에 관한 연구 (Investigating English reading processes of Korean college students through reciprocal reading strategy)

  • 나경희;이선
    • 영어어문교육
    • /
    • 제11권4호
    • /
    • pp.209-235
    • /
    • 2005
  • The purpose of the present study was to investigate the effectiveness of reciprocal teaching procedure for improving Korean college students' reading comprehension of English text. In particular, this study sought to explore the qualitative features, if any, in students' use of reading comprehension strategies presented in the process of Reciprocal Reading Procedure (RRP). In order to accomplish the goal of the study, transcripts of the students' dialogues, open-ended questionnaires, and researchers' observation notes were examined. The results of the study showed that the participants used different four kinds of reading strategies in the process of RRP (questioning, clarifying, predicting, summarizing). The findings also suggested that the readers with limited knowledge of vocabulary had difficulty in moving on to the next level. Additionally, future research direction and some pedagogical implications are presented for the practical EFL classroom.

  • PDF