728x90
반응형

파일처리 8

ch6-2) Organizing Files for Performance

Binary Search and Internal Sorting1. Sequential search - At most n comparisons -> O(n) - Too expensive -> keyed access를 다루기 위해 더 나은 방법을 찾아야함 2. Binary search - At most [log2 n] + 1 comparisons -> O(log n) - 단, 파일이 키 기준으로 정렬되어 있어야 함 3. Internal sort - RAM 안에 있는 디스크 파일을 읽어 정렬 (Disk 에서 RAM으로 데이터를 올린 후에 sort) ( 통째로 올려서 sort하는 방식) - 얼마나 적게 읽고 사용했는가? - 데이터가 많은 경우에는 유용석하지 못하다 4. external sor..

파일처리 2025.04.24

파처 ch6) Organizing Files for Performance

삭제된 공간을 재활용 Data Compression (데이터 압축)1. 파일 사이즈가 작아짐 (1) 더 적은 공간을 사용해서 cost saving이 된다 (2) 접근 시간이 줄어들고 빠르게 전송 가능 (3) 순차적으로 빠르게 접근 가능 2. 단점은 별도의 인코딩, 디코딩 작업이 필요함 1. Using a Differnt Notation1. 압축 기법의 하나로, 더 간결한 표기를 찾아 비트 수를 줄이는 방식 (중복 제거(redundancy reduction)에 해당하는 압축 방식) ex) state : 2bytes -> 6bits 사용 50개의 데이터'L''A' -> 0'N''Y' -> 1...'C''Y' -> 49는 2^6 = 64개의 조합으로 모든 주를 표현 가능 2. Suppressing Re..

파일처리 2025.04.17

파처 ch5) Managing Files of Records

Record Keys1. Primary key - 키값이 존재한다면 유일한 레코드 값을 가져야 함 - 바뀔수가 없음 2. Secondary key - 레코드 값이 유일하지 않아도 됨 - ex) 이름, 도시 이름, 주소 등 3. Canonical form - 키의 형태를 통일된 형태로 변환을 하고나서 다룸ex) Ames, AMES, ames -> AMES로 변환 Sequential Search1. 순차 탐색 성능 평가 (1) read() 호출 수로 성능을 측정 - 파일에서 데이터를 읽는 read() 시스템 호출을 기준으로 성능을 평가 문제점 : 이 가정은 엄밀히 말하면 정확하지 않음 운영체제의 버퍼링(buffering) 덕분에 실제로는 성능이 더 나올 수 있음 (하지만 ..

파일처리 2025.04.15

파처 ch4) Fundamental File Structure Concepts

사람 정보 저장 문제점- 사람 record 간에 구별이 되어있지 않음- record 안에서 field에 대한 구별이 되어있지 않음  File Organization- field : 논리적인 의미를 갖는 가장 작은 단위    - Fixed-length fields    - Variable-length fields         (1) Begin each field with a length indicator         (2) Separate the fields with delimiters         (3) Use  "keyword = value" expression to identify fields - record : field의 집합 (파일을 더 높은 수준의 조직체계로 볼 때 사용)    - Fix..

파일처리 2025.04.10

파일처리 ch4) Flash memory overview and Hybrid Mapping

Evolution of Storage Medium Flash Memory의 위치 NOR : 캐시 메모리처럼 작고 속도는 엄청 빠름(고가)NAND : 범용 데이터를 저장(문서, 동영상 등), NOR에 비해 저가 가격 비교 -> HDD 와 SDD의 가격 차이가 점점 줄어들고 있음 플래시 메모리를 쓰는 이유1. 빠른 접근 속도 (데이터를 읽고/쓰기 위해서, 하드 디스크보다 평균적으로 빠르다)-> 덮어쓰기 등 과정에서 느릴 가능성도 있음 2. 작은 전력 소비량(하드 디스크는 기계적인 장치로 구성되어 있기 때문에 전력 소비량이 크다)(플래시 메모리는 기계적인 장치가 없음) 3. 내구성4. 작은 크기5. 작은 무게6. 소리가 안 남 NAND Flash Memory 구조- 각 칩은 N개의 Block으로 구성- 각 ..

파일처리 2025.03.25

파일처리 ch3) 보조 저장장치와 시스템 소프트웨어

하드 디스크 드라이브 Platters : 데이터 저장 장소Slider(and Head) : 읽거나 쓰는 용도Spindle : 모터에 의해 돌아감 (Platter를 돌리기 위한 용도)SCSI Interface Connector : 데이터 이동 통로 하드 디스크 드라이브의 도식적 설명  Boom : 읽기/쓰기 헤드를 지탱하는 암Platters : 데이터가 저장되는 원형 디스크 표면Spindle : 디스크를 회전시키는 모터  디스크 표면에 있는 트랙과 섹터 트랙 : 디스크 표면에 원형으로 형성된 데이터 기록 경로          (트랙의 바깥면과 안쪽면의 용량은 동일)섹터 : 데이터 저장의 가장 작은 단위로 보통 512 바이트   실린더(cylinder) cylinder : 각 트랙을 모아놓은 집합 -> 디스..

파일처리 2025.03.23

파일처리 ch2) 파일처리 기본 연산에 대한 소개

physical Files and Logical Files1. Physical File실제로 디스크나 저장 장치에 존재하는 파일.운영체제(OS)가 파일 시스템을 통해 관리.파일 디렉토리에 존재하며, OS의 인터페이스를 통해 접근 가능.2. Logical File프로그램이 인식하는 파일.프로그램은 어떤 물리적 파일이 사용될지 알지 못한 채 논리적 파일을 다룸.   Physical files과 Logical files의 연결 1. Mainframe era : Job Control Language 을 통해 파일 연결2. Unix and DOS era  - 프로그램 내 명령으로 파일 연결(os 시스템 호출 또는 프로그래밍 언어의 일부) - ex) select inp_file assign to "myfile.da..

파일처리 2025.03.23

파일처리 ch1) 파일 구조 설계와 명세 소개

디스크는 왜 느릴까?? RAM vs 디스크 속도 비교! - RAM : 약 120ns - 디스크 : 약 30ms => 이를 비유하면, RAM의 1초 = 디스크의 2일 22시간But, 디스크는 저렴하고 비휘발성이라 대용량 저장에 유리 추가 설명) 디스크는 저장 공간이 크고 가격도 저렴하지만, 접근 속도는 RAM에 비해 매우 느립니다.                 파일 구조 설계는 이런 속도 차이를 극복하고 최적의 데이터 접근을 가능하게 하는 기술입니다.                 (최대한 빠르게 원하는 정보를 얻기 위한 전략) 파일 구조 설계가 왜 필요한가???1. 파일(FILE)이란 ?  - 하드 디스크 , 솔리드 스테이트 디스크, CD, 테이프 등과 같은 보조 기억 장치에 저장된 동일 종류의 레코드 집..

파일처리 2025.03.23
728x90
반응형