관리 메뉴

누리그물 한말글 모임

21세기 세종계획(1999)(홍재성) 본문

곳간/한말글 곳간

21세기 세종계획(1999)(홍재성)

누리그물 한말글 모임 2015. 9. 18. 07:30

21세기 세종계획(1999)

- 전자사전 개발 -

홍재성




1. 총론 1

   1.1. 연구의 필요성 1

   1.2. 연구의 목표 1

   1.3. 전자사전의 개념 2

   1.4. 국내외 현황 3

        1.4.1. 국외 연구 현황 3

        1.4.2. 국내 연구 현황 8

   1.5. 세종 전자사전의 전체적 구성 및 위상 9

        1.5.1. 세종 전자사전의 구성 9

        1.5.2. 세종 전자사전의 위상 10

   1.6. 연구 사업 내용 11

        1.6.1. 단계별 연구 내용 11

        1.6.1.1. 제 1 단계 (1998-2000) 12

        1.6.1.2. 제 2 단계 (2001-2003) 13

        1.6.2. 당해년도 연구 사업 내용 14

   1.7. 연구 결과 및 기대효과 16

        1.7.1. 다양한 응용 언어공학 발전에 기여 16

        1.7.2. 언어학 및 국어학의 발전에 기여 18

        1.7.3. 인지과학 및 심리학 발전에 기여 18

2. 확장 어휘목록 선정 20

   2.1. 확장 어휘 목록 작성의 목적과 배경 20

        2.1.1. 확장 어휘 목록 작성의 목적 20

        2.1.2. 배경과 의의 20

               2.1.2.1. 어휘기술 목표량 할당의 문제 20

               2.1.2.2. 기술 대상 어휘 선정의 문제 21

               2.1.2.3. 어휘 선정 작업 효율성의 문제 22

               2.1.2.4. 의의 22

   2.2. 선정 과정 24

        2.2.1. 확장 어휘 목록 구축 목표량 24

        2.2.2. 원시 어휘 목록의 설정 24

        2.2.3. 작업 진행 방법 25

   2.3. 확장 어휘 목록의 구성 27

        2.3.1. 기초 정보의 종류 27

        2.3.2. 확장 어휘 목록의 논리구조 28

        2.3.3. 목록파일의 관리 28

   2.4. 확장 어휘 목록 열람기 29

3. 체언 전자사전 구축 지침 30

   3.1. 서론 31

        3.1.1. 99년도 연구목표와 내용 31

        3.1.2. 98년도 작업과의 비교 31

        3.1.3. 연구진 구성과 작업분담 32

               3.1.3.1. 체언 전자사전 구축 32

               3.1.3.2. 통합전자사전 구축 및 관리‧평가 분과 33

               3.1.3.3. 전자 사전 구축 지원 분과 33

        3.1.4. 작업추진 절차 33

               3.1.4.1. 체언 사전 기술 33

               3.1.4.2. 통합 전자사전 구축 및 관리·평가 34

               3.1.4.3. 전자사전 구축지원 작업       34

        3.1.5. 시기별 연구 작업 추진 일정 34

        3.1.6. 99년도 최종 결과물 35

   3.2. 본론 36

        3.2.1. 체언 사전의 구성과 위상 36

        3.2.2. 거시구조 구성 38

               3.2.2.1. 표제어의 규모 및 선정 원칙 38

               3.2.2.2. 체언 범주 분석의 문제 38

               3.2.2.3. 표제어의 분할 (동형어 처리) 44

               3.2.2.4. 표제어의 배열 45

        3.2.3. 미시구조 구성 46

               3.2.3.1. 표제어 관리 정보 구획 46

               3.2.3.2. 최상위 정보 구획 46

               3.2.3.3. 의미정보 구획 51

               3.2.3.4. 통사정보 구획 62

               3.3. 정보의 제시 형식 및 배열 원칙 71

        3.3.1. 체언 사전의 논리 구조 및 정보 항목 약호 71

               3.3.1.1. 체언 항목의 논리 구조 71

               3.3.1.2. 논리구조에 따른 정보항목 약호 73

        3.3.2. 체언 사전 정보 항목 표기법 75

               3.3.2.1. 기호 일람 75

               3.3.2.2. 구획별 정보항목 표기 용례 76

        3.3.3. 99년도 작업의 특성 - 거시/미시 구조의 구성 및 내용 100

               3.3.3.1. 거시구조 100

               3.3.3.2. 미시구조 100

               3.3.3.3. 향후 기술 형식 및 보완될 정보 내용 101

               3.3.3.4. 체언사전과 통합사전의 논리구조 대응 119

   3.4. 기술 표본 : 기존 사전들과의 대비 125

        3.4.1. 기존 사전과의 비교 125

               3.4.1.1. 실제 언어 사용의 반영 125

               3.4.1.2. 정보의 다양성 125

               3.4.1.3. 의미 기술의 정밀화 125

        3.4.2. 기술 예 127

   3.5. 결론 137

        3.5.1. 99년도 작업의 의의 137

               3.5.1.1. 1차년도 표본 기술 작업의 보완 및 확장 137

               3.5.1.2. 대규모 기술을 위한 준비 작업 137

               3.5.1.3. 제반 문제의 정비 및 조정 137

        3.5.2. 문제점 및 해결 전망 138

               3.5.2.1. 명사 의미부류의 설정 138

               3.5.2.2. 술어명사 논항의 의미역 기술 138

               3.5.2.3. 표제 명사의 수식어/ 표제 명사의 수식어 기능 138

               3.5.2.4. 기술 형식, 정보 표기방식의 일관성 138

               3.5.2.5. 말뭉치의 효과적 활용 139

4. 용언 전자사전 분과   140

   4.1. 총론 141

        4.1.1. 용언 전자사전의 목표와 성격, 범위 141

        4.1.2. 제2차년도(1999년) 연구 목표 및 추진 상황 142

               4.1.2.1. 연구 목표 및 내용 142

               4.1.2.2. 연구 추진 상황 143

               4.1.2.3. 연구의 주요 성과 144

               4.1.2.4. 제1차년도(1998년) 작업과 비교 : 제2차년도의 특징 145

               4.1.2.5. 병행하여 추진한 사업 147

   4.2. 표제어 선정과 구성 147

        4.2.1. 용언의 표제어 선정 기준 147

               4.2.1.1. 용언 하위 분류 147

               4.2.1.2. 동사 목록 선정시 고려 사항 149

               4.2.1.3. 형용사 목록 선정시 고려 사항 149

        4.2.2. 동형어 처리 우위의 원칙 150

        4.2.3. 표제어 분할과 선정 150

               4.2.3.1. '최상위 표제어'와 표제어 150

               4.2.3.2. 동형어 구분 151

        4.2.4. 1차 구분 : 동형어 분할 152

   4.3. 표제어 정보 그룹 153

        4.3.1. 정의 153

        4.3.2. 표제어 표기 정보 153

        4.3.3. 변이형 정보 154

        4.3.4. 외래어 원어 정보 154

   4.4. 형태 정보 그룹(morGrp) 155

        4.4.1. 정의와 내용 155

        4.4.2. 품사정보 <posTag> 155

        4.4.3. 활용 정보 156

        4.4.4. 축약정보 <cntr> 160

        4.4.5. 성분 구성 정보 <cnst> 164

        4.4.6. 복합어 정보 <cmpst> 166

   4.5. 구문 정보 그룹 167

        4.5.1. 구문 유형 168

   4.5.1.1. 하위범주화 168

   4.5.1.2. 표기 체계 169

        4.5.2. 격틀 정보 169

               4.5.2.1. 정의 170

               4.5.2.2. 동사/형용사의 유형별 격틀 기술 체계 171

               4.5.2.3. 논항의 구조 기술 174

               4.5.2.4. 논항의 구조 기술 : 수정 및 보완 180

               4.5.2.5. 형용사 격틀의 유형 183

               4.5.2.6. 격틀 기술의 문제와 과제 188

        4.5.3. 선택 제약 정보 190

               4.5.3.1. 정의와 표상 190

               4.5.3.2. 명사 부류 표시 191

               4.5.3.3. 선택 제약 표상의 과제 194

        4.5.4. 구조의 변형적 속성 196

               4.5.4.1. 재구조화 196

               4.5.4.2. 격조사 교체 198

   4.6. 의미역 정보 198

        4.6.1. 의미역 정보의 정의 198

        4.6.2. 의미역 할당의 기본 원칙 200

        4.6.3. 의미역 정보의 유형 203

               4.6.3.1. 대상 (Theme: THM) 204

               4.6.3.2. 행위주 (Agent: AGT) 205

               4.6.3.3. 경험주 (Experiencer: EXP) 207

               4.6.3.4 동반주 (Companion: COM) 208

               4.6.3.5. 처소 (Location: LOC) 210

               4.6.3.6. 출발점 (Source: SRC) 211

               4.6.3.7. 도착점 (Goal: GOL) 212

               4.6.3.8. 방향 (Direction: DIR) 212

               4.6.3.9. 도구 (Instrument: INS) 213

               4.6.3.10. 이유 (Reason: RSN) 215

               4.6.3.11. 수령주 (Recipient: RCP) 215

               4.6.3.12. 자격 (Appraisee: APP) 216

               4.6.3.13. 기준치 (Criterion: CRT) 216

               4.6.3.14. 정도 (Degree: DGR) 216

               4.6.3.15. 의미역 총괄 217

        4.6.4. 의미역의 명세 방법 220

        4.6.5. 의미역 설정의 문제와 과제 220

   4.7. 의미 정보 그룹(semGrp) 221

        4.7.1. 정의 221

        4.7.2. 용언의 의미 기술 222

        4.7.3. 용언의 의미 기술의 과제 224

   4.8. 결합 정보 그룹(comGrp) 226

        4.8.1. 정의 226

        4.8.2. 결합 제약 정보 <morRst> 226

               4.8.2.1. 조사 <jsRst> 227

               4.8.2.2. 어말어미 <endRst> 227

               4.8.2.3. 선어말어미 <prendRst> 228

        4.8.3. 연어 정보 229

               4.8.3.1. 정의 229

               4.8.3.2. 유형과 범위 229

        4.8.4. 구성관계 정보 230

               4.8.4.1. 정의 230

               4.8.4.2. 유형과 정보 231

               4.9. 관용 표현 정보(idmGrp) 232

        4.9.1. 정의 232

        4.9.2. 유형 232

               4.9.2.1. 숙어 232

               4.9.2.2. 관용어 233

               4.9.2.3. <속담> 또는 <격언> 233

               4.10. 기타 정보 그룹(etcGrp) 234

               4.11. 관리 정보 그룹(mntGrp) 234

               4.12. 결론 235

[약호 및 부호 일람] 237

[표본 용언의 기술 (예시)] 240

5. 복합어 사전 구축 지침 279

   5.1. 복합어 사전의 성격 및 위상 280

   5.2. 복합어 사전 구축의 기본 문제들 280

        5.2.1. 표제어 관련 정보 283

               5.2.1.1. 표제어 선별 원칙 및 규모 283

               5.2.1.2. 표제어 배분(범주 분석의 문제) 284

        5.2.2. 형태 정보 284

               5.2.2.1. 변이형, 약어 및 본디말 284

               5.2.2.2. 복합어의 내적 구조 284

               5.2.2.3. 외래어 원어 284

               5.2.2.4. 동형어/파생어/합성어 284

               5.2.2.5. 관용 표현 정보 285

        5.2.3. 의미 정보 285

               5.2.3.1. 동형어와 다의어 285

               5.2.3.2. 다의어 의미 분할의 기준 및 제시 방법 287

               5.2.3.3. 의미(하위) 부류 287

               5.2.3.4. 가산/비가산 명사 288

               5.2.3.5. 관계/대칭 명사 288

               5.2.3.6. 영어 대역, 레지스터, 내포 의미 288

               5.2.3.7. 어휘 관계 288

        5.2.4. 통사 정보 290

               5.2.4.1. 수식어, 조사, 분류사 등과의 결합 제약 291

               5.2.4.2. 용언과의 자유 결합 294

               5.2.4.3. 용언과 결합된 연어 구성 295

   5.3. 정보의 제시 형식 및 배열 원칙 303

   5.4. 어휘별 항목 기술 예 303

   5.5. 집필상의 문제점 309

   5.6. 병행 연구 과제: 접사 목록 312

6. 고유명사 전자사전 분과 337

   6.1. 총론 338

        6.1.1 서론 338

        6.1.2. 작업 분담 338

        6.1.3 작업 일정 339

        6.1.4 작업진행 절차 및 방식 개관 340

   6.2. 구축지침서 수정 341

        6.2.1 고유명사 분류 체계 341

        6.2.2. 사전 정보 항목 및 표기 방법 343

        6.2.3 필수 입력 항목 344

        6.2.4 복합어원 345

        6.2.5 구분자 345

        6.2.6 정보 미부착 공란 345

        6.2.7 참조할 보통명사 346

        6.2.8 한자 처리 문제 346

   6.3. 고유명사 입력기 요구사항 347

        6.3.1 입력방식의 다양화 347

               6.3.1.1 텍스트 파일 가져오기 347

               6.3.1.2 데이터베이스 파일 가져오기 348

        6.3.2 동음이의어 및 다의어 처리 348

               6.3.2.1 예상되는 문제점 348

               6.3.2.2 해결책 349

        6.3.3. 검색과 텍스트 파일로의 저장 기능 349

               6.3.3.1. 검색기능 349

               6.3.3.2 텍스트 파일로의 저장기능 351

   6.4. 상세정보 기술을 위한 기초작업 과정 354

        6.4.1 원시자료 추출 354

        6.4.2 원시자료 정리 354

        6.4.3 임포트용 텍스트 파일 생성 354

        6.4.4. 고유명사 입력기에서 텍스트문서 임포트 355

   6.5. 결론 356

        6.5.1. 작업성과 356

        6.5.2. 문제점 및 해결 방안 356

               6.5.2.1. 목록 선정을 위한 기초자료 확보 356

               6.5.2.2 한자 입력 356

7. 조사․어미 전자사전 분과   362

   7.1. 서론 363

        7.1.1. 조사․어미사전의 성격 및 위상 363

               7.1.1.1. 조사․어미사전의 목표 363

               7.1.1.2. 다른 하위사전들과의 관계 363

               7.1.1.3. 전자사전으로서의 성격 365

               7.1.1.4. 제한 사항 365

               7.1.1.5. 지침서의 목적 366

        7.1.2. 1999년도 연구 목표와 내용 367

        7.1.3. 시기별 작업 추진 내용 368

        7.1.4. 작업 진행 절차 및 방식 369

               7.1.4.1. 조사사전과 어미사전 구조의 통합 369

               7.1.4.2. 용례 정보 추출 369

        7.1.5. 최종 결과물 370

   7.2. 조사․어미사전의 거시구조 371

        7.2.1. 표제어 선정 371

        7.2.2. 표제어의 분할 373

               7.2.2.1. 조사 373

               7.2.2.2. 어미 373

        7.2.3. 연속형의 표제화 376

               7.2.3.1. 연속형(serial)의 정의 376

               7.2.3.2. 연속형 표제화의 원칙 376

        7.2.4. 선어말어미의 표제화 378

   7.3. 조사․어미 전자사전의 항목구조 379

   7.4. 정보 제시 방법 381

        7.4.1 <superEntry>와 <entry> 381

               7.4.1.1. 예시 381

               7.4.1.2. <superEntry> 381

               7.4.1.3. <entry> 381

        7.4.2. 관리정보 그룹(<mntGrp>)의 정보제시 방법 383

               7.4.2.1. 예시 383

               7.4.2.2. <mntGrp> (maintenance group. 관리 정보 그룹) 383

               7.4.2.3. <dic> (dictionary name) 383

               7.4.2.4. <wrt> (writer) 집필자. 384

               7.4.2.5. <crd> (creation date) 최초 집필일. 384

               7.4.2.6. <mdd> (modification date) 최종 수정일. 384

               7.4.2.7. <note> 메모, 참고 사항 384

        7.4.3. 표제어 정보 그룹(<headGrp>)의 정보제시 방법 386

               7.4.3.1. 예시 386

               7.4.3.2. <orth>(표제어 표기 형태) 386

               7.4.3.3. <phnRst> (음운 제약) 386

               7.4.3.4. <morRst>(이형태 교체를 결정하는 선행어 末형태 조건) 387

        7.4.4. 형태 정보 그룹(<morGrp>)의 정보 제시 방법 388

               7.4.4.1. 예시 388

               7.4.4.2. <morGrp> (형태 정보 그룹) 388

               7.4.4.3. <posTag> (하위 품사 분류) 388

               7.4.4.4. <cnst> (constituent. 내부 구성 정보) 389

               7.4.4.5. <var> (이형태 및 변이형) 390

        7.4.5. 의미정보 그룹(<semGrp>)의 정보제시 방법 394

               7.4.5.1. 예시 394

               7.4.5.2. <semGrp> (의미 정보 그룹) 394

               7.4.5.3. <sense> (의미) 395

               7.4.5.4. <semRep> (의미 표시) 395

               7.4.5.5. <frn> (선행 조사, 어미; forerunner), <fol> (후행 조사, 어미; follower). 396

               7.4.5.6. <frame> (선행 요소와의 결합 관계식) 398

               7.4.5.7. <selRst> 선행요소 선택제약 400

               7.4.5.8. <ownS> (자기 절에 걸리는 문법적 제약) 402

               7.4.5.9. <folS> (후행절에 걸리는 문법적 제약) 402

               7.4.5.10. <eg> (용례) 403

               7.4.5.11. 그 밖의 통사의미적 정보 403

        7.4.6. 관용표현정보 그룹(<idmGrp>)의 정보제시 방법 404

               7.4.6.1. 예시 404

               7.4.6.2. 관용표현 정보 그룹(idiom Group) 404

               7.4.6.3. <idmExp> 404

   7.5. 기호 406

        7.5.1. 경계 기호 406

        7.5.2. 범주 기호 407

   7.6. 표본 기술 사례 408

        7.6.1. 조사 408

        7.6.2. 어미 418

   7.7. 결론 423

        7.7.1. 1999년 작업의 의의 423

        7.7.2. 문제점과 해결 전망 424

8. 통합전자사전 구축 및 관리‧평가 분과 426

   8.1. 연구 목표 427

   8.2. 연구 내용 427

   8.3. 연구 결과 430

        8.3.1. Sejong-Dic Editor (전자사전 입력기) 430

        8.3.2. Sejong-Dic Eval (전자사전 평가․검증) 434

               8.3.2.1. 외형 검증(Formal Validation) 434

               8.3.2.2. 내용 검증(Content Validation) 435

               8.3.2.3. 평가․검증 결과 439

        8.3.3. Sejong-Dic Manager (통합 전자사전 관리 시스템 : TDMS) 441

               8.3.3.1. 기능 442

               8.3.3.2. 문제점 451

                    8.3.4. Sejong-Dic Net (통합 전자사전 브라우저) 453

   8.4. 결론 455

9. 전자사전 구축 지원 분과 457

   9.1. 개요 458

   9.2. 자료 관리 체계상의 지원 작업 459

        9.2.1. 1998년 자료 현황 459

        9.2.2. 1999년 자료 규모 460

        9.2.3. 자료관리체계 정립의 필요성 460

        9.2.4. 자료관리체계의 구성도 461

        9.2.5. 자료관리체계상의 지원부문 462

        9.2.6. 원고파일 버전관리 방안의 모색 462

   9.3. 핵심사전 확장어휘목록 작성 지원 464

        9.3.1. 어휘목록 작성에 대한 고려사항 464

        9.3.2. 어휘목록 작성 지원 작업 과정 465

        9.3.3. 차기년도 대비 어휘목록 관련 작업 검토 466

   9.4. 사전구축 지원도구 개발 관련 지원작업 467

        9.4.1. 전자사전 지원도구 현황 467

        9.4.2. 도구개발 관련 지원 작업 부문 467

        9.4.3. 지원도구 개발의 고려점 468

   9.4.3.1. 개발방향 전환단계에서의 고려사항 468

   9.4.3.2. 사전 구축의 대규모적, 장기적 성격에 따른 고려사항 469

   9.5. 기타 지원 작업 471

        9.5.1. 신규 하위사전 구축작업 회의 참석 471

        9.5.2. 집필 보조자료 관리 및 가공 471

        9.5.3. 어휘기술 현황판 개설 관련 검토 471

   9.6. 차기년도 대비 지원 작업 부문 472

        9.6.1. 핵심사전 어휘확장목록의 확충 및 유지 472

        9.6.2. 사전구축을 위한 언어자원 관리작업 472

        9.6.3. 온라인 작업현황판 개설 및 유지 472

        9.6.4. 세종계획 전자사전 술어집 편집·관리 지원 472

10. 결론 474

    10.1. 99년도 작업의 성격 474

    10.2. 전망 475


참고문헌 476




21세기 세종계획(1999).hwp






728x90
반응형