본문 바로가기

Computer Science72

[데이터베이스] 7장 릴레이션 정규화 7-1 정규화 개요 1. 릴레이션 정규화 db설계 제대로 안하면 갱신 이상을 유발함. 정규화는 주어진 릴레이션을 분해함으로써 중복과 세가지 갱신 이상을 최소화함. 2. 갱신 이상과 중복 수정 이상: 데이터 일부만 수정해 데이터 불일치 발생. 삽입 이상: 불필요한 정보를 함께 저장 안하면 어떤 정보를 저장하는 것이 불가능 삭제 이상: 유용한 정보를 함께 삭제 안하면 삭제가 불가능. 중복 -> 릴레이션 분해로 해결하자~ 7-2 함수적 종속성 1. 함수적 종속성 만약 애트리뷰트 A가 애트리뷰트 B의 결정자이면 B가 A에게 함수적으로 종속한다 정규화 이론의 핵심 제2정규형부터 BCNF까지 적용됨. 완전 함수적 종속성: 애트리뷰트 B가 애트리뷰트 A에 함수적으로 종속하면서 애트리뷰트 A의 어떤 진부분집합에도 함수.. 2023. 12. 12.
[인공지능] SP09. Regularization 0. Overfitting training 데이터와 다른 값들이들어오면 loss가 커짐. generalization과 반대! 1. Regularization techniques generalization하게 만들기 위한 방법들의 집합. 9-1 Explicit regularization 1. Explicit regularization g[ϕ]: 매개변수가 덜 선호될 때 큰 값을 반환하는 스칼라를 반환하는 함수. 어떤 매개변수를 덜 선호하도록 유도 λ: 원래 손실 함수와 정규화 항의 상대적인 기여를 제어하는 양의 스칼라. a) Gabor모델의 손실함수 b) 중심에서 멀어질 수록 증가하는 패널티를 추가해 매개변수가 중심에 가까워지도록 유도 최종 손실함수는 원래 손실함수 + 정규화 항의 합 2. 확률적 해석 기.. 2023. 12. 9.
[데이터베이스] 6장 물리적 데이터베이스 설계 0. 물리적 데이터베이스 설계 논리적인 설계의 데이터 구조를 보조 기억 장치 상의 화일로 사상함. 6-1 보조 기억 장치 1. 보조 기억 장치 DBMS는 사용자가 원하는 데이터를 포함하고 있는 블록을 디스크에서 주기억장치로 가져와야함. 데이터가 변경된 경우 블록들을 디스크에 다시 기록. 보통 블록의 크기는 4,096바이트. 각 화일은 고정된 크기의 블록들로 나누어져서 저장됨. - 디스크 디스크는 데이터베이스를 장기간 보관해주는 보조 기억 장치. 전체 데이터베이스가 디스크에 저장됨. 컴퓨터 시스템이 다운되는 경우에도 디스크의 데이터베이스는 손상 안됨. 직접 접근 장치이므로, 디스크 상의 임의의 위치에 있는 데이터를 바로 접근할 수 있음. 디스크에서 임의의 블록을 읽거나 기록하는데 걸리는 시간 = 탐구시간 .. 2023. 11. 26.
[데이터베이스] 5장 데이터베이스 설계와 ER모델 (2) 5-3 데이터베이스 설계 사례 1. 설계할 요구사항 명세 회사에는 여러 사원들이 재직한다. 각 사원에 대해 사원번호(고유)/이름/직책/급여/주소를 저장한다. 주소는 시, 구, 동으로 세분해 나타낸다. 각 사원은 0명 이상의 부양가족을 갖는다. 각 부양가족의 이름과 성별을 저장한다. 회사는 여러 프로젝트를 진행한다. 각 프로젝트에 대해 프로젝트번호(고유)/이름/예산/프로젝트진행위치를 저장한다. 각 프로젝트마다 여러명의 사원이 일함. 각 사원이 해당 프로젝트에서 어떤 역할을 수행하고, 얼마 동안 근무해 왔는지 나타냄. 각 프로젝트마다 한 명의 프로젝트 관리자가 있음. 한 사원은 두 개 이상의 프로젝트 관리자가 될 수는 없음. 프로젝트 관리자 임무를 시작한 날짜를 기록. 각 사원은 한 부서에만 속한다. 각 부.. 2023. 11. 26.
[데이터베이스] 5장 데이터베이스 설계와 ER모델 (1) 0. 데이터베이스 설계 - 종류(2): 개념적 데이터베이스 설계, 물리적 데이터베이스 설계 개념적 데이터베이스 설계: 엔티티, 관계, 프로세스, 무결성 제약조건 등을 나타내는 추상화 모델 구축. 물리적 데이터베이스 설계: 물리적인 저장 장치, 접근 방식을 다룸. 엔티티: 조직체에서 데이터베이스에 나타내려는 객체.(사람, 장소, 사물 등) 관계: 두 개 이상의 엔티티들 간의 연관 프로세스: 관련된 활동 (?) 무결성 제약조건: 데이터의 정확성, 비즈니스 규칙을 의미. 1. 개념적 수준의 모델 : 특정 데이터 모델과 독립적으로 응용 세계를 모델링 할 수 있도록 함. 하향식 개발을 위한 틀을 제공. → 인기 개념적 수준의 모델: 엔티티-관계(Entity-Relationship) 모델 + 구현 데이터 모델: 개.. 2023. 11. 25.
[인공지능] SP06. Fitting Models 0. Review Shallow network, Deep network Loss function Learning model -> loss를 줄이는 파라미터 값을 어떻게 찾냐! 학습 과정 (1) 파라미터 초기값 설정 (2) 손실에 대한 기울기(gradient, derivatices, 도함수) 계산 (3) 기울기로 손실 감소를 위해 파라미터 조정 (2), (3) 과정 반복 ▶ 이번 단원에서는 파라미터를 어떻게 조정해서 손실을 줄이는지 다룰 예정. 6-1. Gradient descent 1. Gradient descent 모델 fit을 위해서는 training set {xi, yi}가 필요. 입력 xi를 출력 yi로 잘 매핑하는 모델 f[xi, ϕ]의 매개변수 ϕ를 찾아야함. 이를 위해 손실함수 L[ϕ]을 정.. 2023. 11. 8.
[데이터베이스] 4장 관계 대수와 SQL 0. 관계 해석, 관계 대수 - 관계 해석: 원하는 데이터만 명시. 질의를 어떻게 수행할 건지는 명시하지 않는 선언적 언어. - 관계 대수: 어떻게 질의를 수행할 것인가를 명시하는 절차적 언어. SQL의 이론적 기초. 관계 연산자들이 수해오디는 순서 명시. 4-1 관계 대수 1. 관계 대수 기존의 릴레이션들로 새로운 릴레이션 생성. 하나의 릴레이션이나 두 개의 릴레이션을 입력받아 하나의 결과 릴레이션 생성. 2. 관계 연산자 종류(11) - 필수적인 연산자(5) 실렉션(σ): 단항. 한 릴레이션에서 실렉션 조건(=predicate)을 만족하는 "튜플"들을 골라냄. 프로젝션(π): 단항. 한 릴레이션에서 애트리뷰트들의 부분 집합을 골라냄. 실렉션 결과에는 중복이 존재할 수 없지만, 프로젝션 연산 결과에는 .. 2023. 11. 3.
[데이터베이스] 3장 오라클 0. 오라클 오라클 사가 개발한 관계 DBMS 높은 시장 점유율, 높은 신뢰성. 대부분의 운영체제, 하드웨어 지원. 표준 에디션1, 표준에디션, 엔터프라이즈 에디션 판매. 개인용 에디션은 윈도우 os 전용. 3-1 오라클 개요 1. 오라클 개요 (외울 필요 없음) 고성능의 인터넷 플랫폼 제공 (온라인 트랜잭션 처리, 데이터 웨어하우스, OLAP, 전자상거래 등) 다양한 멀티미디어 데이터 타입 관리 가능 2. 오라클의 인터넷 플랫폼 - SQL: if 기능이나 반복, scanf, printf 기능이 없음 - PL/SQL: (Programming Language + SQL) -> 오라클에서 사용. 3. 오라클 아키텍쳐 오라클 서버:한 오라클 인스턴스와 오라클 데이터베이스로 구성됨. 오라클 인스턴스: 백그라운드.. 2023. 11. 2.
[소공] 6장 설계 원리 0. 설계 : 요구 분석은 "무엇을" 만들 것인기를 정하는 것. 설계는 "어떻게" 만들 것인가를 정하는것. (1) 기본 구조 설계: 각 모듈의 역할과 인터페이스 정의. (2) 상세 설계: 모듈 내 알고리즘, 데이터 명세화. 6-1 설계 기본 개념 1. 설계 방법 : (과거) 분할 정복, 추상화, 합성 등의 원리 적용. : (최근) 아키텍쳐 기반. 2. 서브 시스템, 모듈 - 아키텍처: 시스템을 구성하는 컴포넌트(서브시스템, 모듈) + 컴포넌트 상호작용의 집합 - 서브시스템: 시스템의 복잡도를 줄이기 위해 분할한 것. 3. 아키텍처 관점(4 + 1) 논리적 관점: UML 클래스도, 상태도, 교류도 프로세스 관점: UML 액티비티도 개발 관점: UML 컴포넌트도 물리적 관점: UML 배치도 유즈케이스 관점:.. 2023. 10. 28.
[소공] 5장 요구 모델링 1. 요구 모델링과 요구 분석의 차이 요구 모델링: 고객과 개발자가 무엇이 개발되고 있는지에 동의하는 것을 주된 목적으로하는 요구 명세 생성. 요구 분석: 시스템에 대한 형식적인 설명 제공. 2. 도메인 지식과 모델링 : 모델링은 도메인 지식(업무 프로세스, 기능, 역할, 규칙)을 체계화하는 과정. 다이어그램으로 정형화함. 5-1 모델링 기초 1. 모델링 하는 이유(7) 복잡함을 잘 관리하기 위해 소프트웨어 구조를 시각화하기 위해 타인과 소통하기 위해 문제 도메인 및 요구사항을 이해하기 위해 개발 중인 시스템을 이해하기 위해 구현 전 솔루션을 실험해보기 위해 기존 시스템을 문서화하기 위해 2. 관점과 추상화 수준 3. 모델 사이의 관계**** 5-2 UML 1. UML : (Unified Modeling.. 2023. 10. 27.