자료 정리 전 점검의 가치
텍스트를 본격 정리하기 전 몇 가지만 점검해 두면 작업 흐름이 흔들리지 않는다. 8가지 체크 항목으로 정리.
1. 입력 자료 형식
한 줄 텍스트인지, 여러 줄 단락인지, CSV 형식인지 사전 인식. 형식에 따라 적용할 변환이 다르다.
2. 줄바꿈 표기
윈도우 \r\n인지, 맥·리눅스 \n인지. 운영체제 사이 자료 옮길 때 호환 점검.
3. 공백 종류
일반 공백·탭·전각 공백 구분. 도구마다 처리 방식이 다르므로 사전 확인.
4. 인코딩
UTF-8이 표준이지만 옛 자료는 EUC-KR·CP949일 수 있다. 깨진 글자가 나오면 인코딩 의심.
5. 길이
도구가 처리 가능한 길이인지. 너무 긴 자료는 단계별 분할 처리.
6. 변환 종류 결정
- 대소문자
- 줄바꿈·공백
- 특수문자 제거
- 정렬·중복 제거
본인 자리에 필요한 변환을 사전 결정.
7. 결과 활용 방식
코드에 그대로 쓸지, 메일·문서에 옮길지, 데이터베이스에 입력할지에 따라 결과 형식 결정.
8. 도구 즐겨찾기
자주 쓸 도구라면 즐겨찾기 등록. 텍스트 변환기를 등록해 두면 다음 작업에 검색 부담 없음.
점검 체크리스트
- 입력 자료 형식 인식
- 줄바꿈 표기 확인
- 공백 종류 점검
- 인코딩 확인
- 길이 적정 여부
- 변환 종류 결정
- 결과 활용 방식
- 즐겨찾기 등록
여덟 항목을 거치면 자료 정리 시작이 단단해진다. 글자 변환기로 점검 결과에 맞춰 변환 처리.
마무리
점검 한 번 거쳐 두면 작업 중 멈추는 일이 줄어든다. 다음 자료 정리 단계로 부드럽게 이어진다.