본 post는 국가생명연구자원정보센터(KOBIC) 주관 서울대학교 의과대학 최무림 교수님의 WES 기초편 강의를 정리한 내용입니다. Intro WES의 개념, 역사, 장단점, 실험적 과정, 의학유전학적 의의를 이해합니다. WES의 개념 WES는 target sequencing의 한 종류입니다. Protein coding region은 hu...
ch9. Expectation, Indicator Random Variables, Linearity
Intro 누적분포함수를 이용하여 특정 사건의 확률과 기댓값을 구하는 방법을 알고, 지시확률변수 및 선형성을 이용하여 기댓값을 구할 수 있습니다. 누적분포함수 (CDF) 누적분포함수는 세 가지 속성을 가지고 있습니다. increasing(증가함수) right continuous (우연속함수) $F(X) \to 0 as X \t...
ch3. Linear Algebra Calculations
기약행 사다리꼴 행렬 (3.1) 가우스-조던 소거법을 사용해서 선형 연립방정식을 풀 수 있습니다. 가우스-조던 소거법은 임의의 행렬을 기약행 사다리꼴 행렬(RREF: Reduced Row Echelon Form)로 변환하여 연립방정식의 해를 쉽게 찾을 수 있습니다. 첨가행렬 (agumented matrix) 선형 연립방정식...
ch2. Introduce Linear Algebra
정의 (2.1) 행렬-벡터 곱 행렬 $A \in \mathbb{R}^{m \times n}$와 벡터 $\vec{x} \in \mathbb{R}^{n}$에 대하여, 행렬-벡터 곱 $A\vec{x}$는 계수 $\vec{x}$를 갖는 행렬 $A$의 열들의 선형결합(linear combination)을 생성합니다. 예를 들어, $3...
ch8. Random Variables and Their Distributions
Intro 확률분포를 해석하는 세 가지 접근방식을 이해하고 적용할 수 있습니다. 이항분포, 초기하분포를 이해합니다. 이항분포 복습 Bin(n, p) 모두 n(양의 정수), p([0, 1] 사이의 값, 확률)에 의해서 분포가 결정됩니다. 이항분포를 해석하는 세 가지 방법이 있습니다. 이...
(EDWITH-KOBIC) 전사체 데이터 분석
Lecture Info Certificate
Sequencing Technologies
Sequencing 개요 about DNA post에서 DNA의 화학구조와 특성을 확인 했습니다. Sequencing의 목적은 pentose sugar의 1’ carbon에 연결된 nitrogenous base의 순서를 확인하는 것임을 또한 확인 했습니다. Sequencing cost per megabases - 2021 https://ww...
about DNA
DNA가 무엇인가요? DNA는 Deoxyribo Nucleic Acid의 약자로 생물의 유전정보를 담고 있는 물질 입니다. DNA는 transcription 과정을 거쳐 RNA(mRNA)로 변환되고, translation 과정을 거쳐 Protein을 생성하는데, 이것은 근육과 결합 조직, 피부 등의 구성요소로 작용할 뿐만 아니라 각종 효소를 생성하...
(EDWITH-KOBIC) NGS 데이터 변이 분석 기초편
Lecture Info Certificate
ch7. Gambler's Ruin and Random Variables
Intro Gambler’s Ruin 문제를 계차방정식을 이용해 풀고, 확률변수의 정의를 이해할 수 있습니다. Gambler’s Ruin A, B 두 명의 gambler가 내기를 합니다. 매 round에서 1 dollar를 걸고 내기에서 이긴 사람이 가져갑니다. A는 i dollar, B는 (N-i) dollar를 가지고 시작합니다. p...