특정 문자열에 데이터가 ','를 기준으로 들어가고 개수는 3개까지 제한되어 들어가지만 1개가 들어갈지 2개가 들어갈지 비어있을지 모르는 상황에서 해당 데이터를 쪼개고 JOIN을 하던지 SubQuery를 날리던지 해야하는 상황이였다.
쉽게 설명하자면 위 그림과 같은 상황이였다.
각각 컬럼별로 쪼개어 넣으면 좋았겠지만, 기존 프로젝트 구조 설계도 이런 기능이 지원되지 않는 상황이였고 어거지로 집어넣었기때문에 개수는 3개제한인점을 활용하여 각각 특수문자를 비교하고 서브쿼리를 통해 처리하기로 하였다.
처리한 방법
1. 먼저 구분자값인 ','의 개수가 몇개인지 파악할 필요가 있었다.
SELECT
SUM((CHAR_LENGTH(column)-CHAR_LENGTH(REPLACE(column,',',''))+1))
FROM TABLENAME
해당 쿼리를 사용하면 특정 데이터의 특수문자나 문자열등의 개수를 체크할수 있다.
사용예시)
2. 다음 해당 개수에 따른 CASEWHEN문을 통해 비교후 SPLIT 하였다.
각각 SPLIT된 데이터의 이름값을 concat_ws메소드를 통해 문자열을 다시 합쳐주었다.
SELECT
CASE
SUM((CHAR_LENGTH(column)-CHAR_LENGTH(REPLACE(column,',',''))+1))
#1개라면 특정테이블에서 바로 조회해온다.
WHEN 1 THEN (SELECT columnName FROM R_FILEUPLOAD WHERE no = column)
#2개라면 ,기준으로 1개만 자른값을 비교하여 넣고
# 2번째까지 가져오고 문자열을 합치다.
WHEN 2 THEN (SELECT concat_ws(
','
,(select columnName from R_FILEUPLOAD
where no = SUBSTRING_INDEX(column, ',', 1))
,(select columnName from R_FILEUPLOAD
where no = SUBSTRING_INDEX(SUBSTRING_INDEX(column, ',', 2), ',', -1))
))
#3개라면 ,기준으로 1개만 자른값을 비교하여 넣고
# 2번째까지 가져오고
# 3번째까지 가져와서 문자열을 합친다.
WHEN 3 THEN (SELECT concat_ws(
','
,(select columnName from R_FILEUPLOAD
where no = SUBSTRING_INDEX(column, ',', 1))
,(select columnName from R_FILEUPLOAD
where no = SUBSTRING_INDEX(SUBSTRING_INDEX(column, ',', 2), ',', -1))
,(select columnName from R_FILEUPLOAD
where no = SUBSTRING_INDEX(SUBSTRING_INDEX(column, ',', 3), ',', -1))
))
END as REAL_NAME;
결과 데이터는 '테스트1,테스트2,테스트3' 의 형태로 처리되었다.
어쩔수 없는 상황에 임시대처로 해당방법을 사용하였고... 어지간하면 컬럼별로 쪼개어서 조인을 하는게 맞는것 같다...
board테이블은 게시판을 나타내는 테이블이며, file_info는 board테이블에 대한 파일 정보를 담고 있는 테이블입니다.
file_info테이블의 board_idx는 board테이블의 idx값을 참조합니다.
select
a.*,
group_concat(b.file_idx, b.file_name SEPARATOR '|')
from(
select
*
from board
limit 0, 10 #paging처리
) a
left outer join file_info b
on a.idx = b.board_idx
group by a.idx;
board 테이블에서 10개의 데이터를 먼저 가져오고, 해당 데이터를 a라고 별칭을 처리하고 file_info테이블의 참조컬럼을 join합니다.
group_concat을 통해 각각 파일에 대한 idx값인 file_idx컬럼과 file_name컬럼을 붙여서 출력합니다.
SEPARATOR 키워드는 이름 그대로 구분자를 지정할 수 있습니다. 부득이한 상황으로 쉼표 구분자를 사용할 수 없다면 해당 키워드를 추가하여 구분값을 변경해주세요. SEPARATOR 키워드가 없으면 기본값인 쉼표로 구분처리 됩니다.
프로젝트 진행도중 특정 테이블에 특정 구분자값으로 구분된 문자열을 통으로 넣어줄테니 알아서 파싱하여 쓰세요같은 불친절한 일이 발생했습니다.
처음에 처리방법으로 생각한건 java에서 일정시간마다 스케줄러가 데이터를 수집하고 해당데이터들을 구문별로 나누고 테이블에 insert해주는 방법을 생각했지만, 데이터가 꼬일 우려가 있어 Flag처리를 통한 방법... 또는 스케줄러 동작이 끝나기전에 또 스케줄러가 돌아야 하는 경우가 발생하거나 등등... 여러 문제가 예상되었습니다....
아이디어 회의를 통해 해결 방법으로 제시된게 문자열을 넣어주면 바로 mysql trigger를 사용해보자였고, 예전에 pg에서 사용해본 기억이 있어서 mysql에서 진행해보았습니다.
총에서 방아쇠를 당기면 총알이 날라가듯 여기서 trigger란 특정 테이블에 어떤 행동 이벤트가 발생하면 발동하는 것을 말합니다.
여기서 이벤트로는 특정 테이블에 INSERT, UPDATE, DELETE가 일어나면 발동 시킬 수 있고, 실행되는 순서도 지정할 수 있습니다. INSERT행위가 일어나기 전에 처리하려면 BEFORE INSERT행위가 일어나고 처리하려면 AFTER 키워드를 사용합니다.
바로 생성방법 사용법을 알아보겠습니다. 급하신분들은 맨 아래로 내려가면 최종 트리거를 볼 수 있습니다.
Trigger 생성하기
DROP TRIGGER IF EXISTS parserTrigger;
delimiter $$
CREATE TRIGGER parserTrigger
AFTER INSERT ON input_table
FOR EACH ROW
BEGIN
INSERT INTO output_table
SET
sender = NEW.data,
timestamp = now();
END
$$delimiter;
이미 같은 이름의 트리거가 존재할경우 지우기 위해 DROP TRIGGER를 사용하였고
CREATE TRIGGER를 통해 트리거의 이름을 parserTrigger라고 만들었습니다.
delimiter라는 키워드도 보이실텐데 생소한분들도 많을 것 같습니다. 제가 지금 생소하거든요.
delimiter는 트리거의 구문을 시작하고 끝내는 키워드라고 합니다. 즉 트리거들의 구분을 위한 키워드로 생각하시면 됩니다.
input_table의 data컬럼에 예시데이터('type1:20;type2:5;type3:15')가 들어오면 substring_indxe를 통해 생성한 변수 type1, 2, 3에 각각 잘라서 값을 넣어주고 값이 비어있지 않다면 각각 INSERT를 처리하는 트리거입니다.
동작을 확인해보겠습니다.
type1에 20
type2에 5
type3에 15
한줄로 들어가 있던 데이터가 정상적으로 들어간 모습을 볼 수 있습니다.
위에서 한 트리거도 동작은 하지만 문제가 있습니다 3개의 데이터가 무조건 있어야 정상동작을 한다는 점입니다.
'type2:5;type3:15' 이것처럼 type1이 안들어오면 버그가 발생합니다.
key값도 받고 길이도 체크할 필요가 있습니다.
최종 완성 - 값이 없으면 넣지 않도록 조건문 추가하기
입력값을 확인하여 동적으로 INSERT하는 TRIGGER
DROP TRIGGER IF EXISTS parserTrigger;
delimiter $$
CREATE TRIGGER parserTrigger
AFTER INSERT ON input_table
FOR EACH ROW
BEGIN
DECLARE dataStr varchar(1000);
DECLARE splitLen INT default 0;
DECLARE type1 varchar(100);
DECLARE type2 varchar(100);
DECLARE type3 varchar(100);
DECLARE typeValue1 varchar(100);
DECLARE typeValue2 varchar(100);
DECLARE typeValue3 varchar(100);
SET dataStr = NEW.data;
SET splitLen = ROUND((CHAR_LENGTH(dataStr) - CHAR_LENGTH(REPLACE(dataStr, ';', '')) / CHAR_LENGTH(';')));
SET type1 = substring_index(substring_index(substring_index(dataStr, ';', 1), ';', -1), ':', 1);
SET type2 = substring_index(substring_index(substring_index(dataStr, ';', 2), ';', -1), ':', 1);
SET type3 = substring_index(substring_index(substring_index(dataStr, ';', 3), ';', -1), ':', 1);
SET typeValue1 = substring_index(substring_index(dataStr, ';', 1), ':', -1);
SET typeValue2 = substring_index(substring_index(dataStr, ';', 2), ':', -1);
SET typeValue3 = substring_index(substring_index(dataStr, ';', 3), ':', -1);
IF type1 is NOT NULL
THEN BEGIN
INSERT INTO output_table (type, value, timestamp) values (type1, typeValue1, now());
END; END IF;
IF splitLen > 0 and type2 is NOT NULL
THEN BEGIN
INSERT INTO output_table (type, value, timestamp) values (type2, typeValue2, now());
END; END IF;
IF splitLen > 1 and type3 is NOT NULL
THEN BEGIN
INSERT INTO output_table (type, value, timestamp) values (type3, typeValue3, now());
END; END IF;
END;
$$delimiter;
추가된 것으로는 아래와 같습니다.
dataStr은 입력이 들어온 data컬럼의 값
splitLen은 ';' 특수문자의 개수
type의 키
typeValue는 값
별개로 받는 변수를 처리하여 IF문에 따라 NULL체크와 길이를 체크하여 INSERT를 제어합니다.
최근 특정 코드별로 쌓이는 테이블을 일정시간마다 호출해서 마지막값을 가져와야 할 일이 생겼다.
여러가지 찾아본 결과는 다음과 같다.
1. order by desc를 통해 select를 해온다.
2. select된 데이터를 한번 더 group by를 한다.
막상 적용해보면 내가 쌓고 있던 테이블의 데이터에서는 group by 후 마지막 날짜의 데이터가 나오지 않았다.
아래와 같은 데이터가 있다고 가정하겠다.
항상 code컬럼의 AAA, BBB, CCC, DDD의 데이터들의 마지막 날짜 데이터들을 가져오는 쿼리를 작성해보겠다.
code컬럼에는 n개가 존재하며 언제나 증가할 수 있다고 가정하고 쿼리를 작성하였다.
아래는 조회에 성공한 쿼리이다.
select
*
from(
select
*
from tb_test
where (code, date_time) in (
select code, max(date_time) as date_time
from tb_test group by code
)
order by date_time desc
) t
group by t.code
먼저 뽑아낼 테이블을 max함수를 통해 마지막 날짜 조회 후 group by를 하고 해당하는 데이터를 조건문에 처리(where 조건문 in절부분)하여 최신 데이터 순으로 order by를 통해 다시 한번 정렬을 한다.
사실 여기까지만 처리해도 정상적으로 볼 수 있지만, 예시데이터처럼 중복된 시:분:초로 들어온 경우 마지막 한개의 데이터가 보장이 되질 않아 마지막에 group by를 한번 더 처리하였다.
아래는 마지막 group by를 안할 경우 발생하는 중복 데이터 노출이다.
처음에 사실 쉽게 처리가 되질 않아 n개의 code값을 group by하여 가져온 후 그 코드값을 where절에 넣고 select를 n번 요청하였는데, 그 방법보단 위 방법이 깔끔한 것 같다.
일반적인 조건문에 따른 update처리는 해봤지만 join문이 들어간 update를 찾아보니
set전에 일반적인 select의 join문을 사용하면 되는 것을 확인하였다.
Join문을 활용한 Update
update
table1 t1
[INNER JOIN | LEFT OUTER JOIN] table2 t2
on t1.joinColumn = t2.joinColumn
set
t1.changeColumn = t2.changeColumn
where
t1.의 조건문
and t2.의 조건문
위 와 같은 문법을 활용하여 update를 처리하면 된다.
사용예시)
r_board와 r_board_detail 테이블이 있다고 가정하겠다.
r_board
d_no
d_code
d_title
d_name
1
2
테스트1
홍길동
2
2
테스트2
홍길자
3
2
테스트3
홍길순
4
2
테스트4
홍길준
r_board_detail
d_no
d_code
d_read
d_update_dt
1
1
50
2020-01-22 09:10:23
2
1
65
2020-01-22 09:15:42
3
2
43
2020-01-22 12:09:55
4
2
55
2020-01-22 14:10:01
r_board code값을 일치시키는 update문을 구성하겠다.
update
r_board b1
INNER JOIN r_board_detail b2
on b1.d_no = b2.d_no
set
b1.d_code = b2.d_code
처리 후에는 r_board의 code값이 r_board_detail 테이블과 동일하게 바뀐 모습을 볼 수 있다.
Mysql DB를 사용하면서 스케줄러를 통해 특정 테이블에서 데이터를 긁어와 insert를 해주는 로직을 작성하였다.
문제는 insert 해주었던 바라보는 기존 테이블이 수정이 일어나면 수정날짜부분을 확인하여 똑같이 수정을 해줘야 하는데, 그때마다 PK값을 가져와서 전부 DELETE하고 다시 INSERT하고 이렇게 자바단에서 처리를 해야하나 골치아픈 상황을 경험하였는데 검색을 통해 INSERT를하면서 PK값이 존재하면 UPDATE를 해주는 ON DUPLICATE KEY UPDATE를 찾았다.
해당 방식은 INSERT를 하다가 PK값이 존재하면 UPDATE를 한다는 조건이 있는데 이 조건을 만족하기 위해 테이블에 무조건 PK값이 지정이 되어있어야 정상적으로 동작한다.