inblog logo
|
moohyun
    SQL문제풀기

    대장균의 크기에 따라 분류하기 2

    난이도 중상
    화낼거양's avatar
    화낼거양
    Dec 24, 2024
    대장균의 크기에 따라 분류하기 2
    Contents
    정답
     
    출처 : https://school.programmers.co.kr/learn/courses/30/lessons/301649
     

    문제 설명

    대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.
    다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.
    Column name
    Type
    Nullable
    ID
    INTEGER
    FALSE
    PARENT_ID
    INTEGER
    TRUE
    SIZE_OF_COLONY
    INTEGER
    FALSE
    DIFFERENTIATION_DATE
    DATE
    FALSE
    GENOTYPE
    INTEGER
    FALSE
    최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.

    문제

    대장균 개체의 크기를 내름차순으로 정렬했을 때 상위 0% ~ 25% 를 'CRITICAL', 26% ~ 50% 를 'HIGH', 51% ~ 75% 를 'MEDIUM', 76% ~ 100% 를 'LOW' 라고 분류합니다. 대장균 개체의 ID(ID) 와 분류된 이름(COLONY_NAME)을 출력하는 SQL 문을 작성해주세요. 이때 결과는 개체의 ID 에 대해 오름차순 정렬해주세요 . 단, 총 데이터의 수는 4의 배수이며 같은 사이즈의 대장균 개체가 서로 다른 이름으로 분류되는 경우는 없습니다.

    예시

    예를 들어 ECOLI_DATA 테이블이 다음과 같다면
    ID
    PARENT_ID
    SIZE_OF_COLONY
    DIFFERENTIATION_DATE
    GENOTYPE
    1
    NULL
    10
    2019/01/01
    5
    2
    NULL
    2
    2019/01/01
    3
    3
    1
    100
    2020/01/01
    4
    4
    2
    16
    2020/01/01
    4
    5
    2
    17
    2020/01/01
    6
    6
    4
    101
    2021/01/01
    22
    7
    6
    101
    2022/01/01
    23
    8
    6
    1
    2022/01/01
    27
    기준에 의해 분류된 대장균들의 ID는 다음과 같습니다.
    CRITICAL (상위 0% ~ 25%) : ID 6, ID 7
    HIGH (상위 26% ~ 50%) : ID 3, ID 5
    MEDIUM (상위 51% ~ 75%) : ID 1, ID 4
    LOW (상위 76% ~ 100%) : ID 2, ID 8
    따라서 결과를 ID 에 대해 오름차순 정렬하면 다음과 같아야 합니다.
    ID
    COLONY_NAME
    1
    MEDIUM
    2
    LOW
    3
    HIGH
    4
    MEDIUM
    5
    HIGH
    6
    CRITICAL
    7
    CRITICAL
    8
    LOW

    정답

     
    WITH RankedEcoli AS ( SELECT ID, SIZE_OF_COLONY, RANK() OVER (ORDER BY SIZE_OF_COLONY DESC) AS rnk FROM ECOLI_DATA ), TotalCount AS ( SELECT COUNT(*) AS cnt FROM ECOLI_DATA ) SELECT ID, CASE WHEN rnk <= cnt * 0.25 THEN 'CRITICAL' WHEN rnk <= cnt * 0.50 THEN 'HIGH' WHEN rnk <= cnt * 0.75 THEN 'MEDIUM' ELSE 'LOW' END AS COLONY_NAME FROM RankedEcoli, TotalCount ORDER BY ID;
     

    설명

    1. RankedEcoli CTE (Common Table Expression):
        • RANK() OVER (ORDER BY SIZE_OF_COLONY DESC) AS rnk: SIZE_OF_COLONY를 기준으로 내림차순으로 정렬하여 순위를 매깁니다.
        • ID, SIZE_OF_COLONY, rnk를 선택합니다.
    1. TotalCount CTE:
        • COUNT(*) AS cnt: ECOLI_DATA 테이블의 총 개체 수를 계산합니다.
    1. 최종 SELECT 문:
        • ID와 COLONY_NAME을 선택합니다.
        • CASE 문을 사용하여 순위(rnk)에 따라 COLONY_NAME을 할당합니다.
          • rnk <= cnt * 0.25: 상위 25%는 CRITICAL.
          • rnk <= cnt * 0.50: 상위 26% ~ 50%는 HIGH.
          • rnk <= cnt * 0.75: 상위 51% ~ 75%는 MEDIUM.
          • 그 외: 하위 76% ~ 100%는 LOW.
        • ID에 대해 오름차순으로 정렬합니다.
     
    💡
    WITH 절은 SQL에서 공통 테이블 표현식(CTE, Common Table Expression)을 정의하는 데 사용됩니다. CTE는 복잡한 쿼리를 더 읽기 쉽고 관리하기 쉽게 만드는 데 도움이 됩니다. CTE는 이름이 있는 임시 결과 집합을 정의하며, 이 결과 집합은 WITH 절 다음에 나오는 쿼리에서 참조할 수 있습니다.
     
     
    Share article
    Contents
    정답

    moohyun

    RSS·Powered by Inblog