* 하이브의 내장 함수

함수 

내용

concat(string a, string b, ...)

문자열 a 뒤에 문자열 b를 붙여서 반환합니다.

예를 들어 concat('facebook', 'hive')를 수행하면 'facebookhive'를 반환합니다.

substr(string str, int start)

문자열 str의 start 인덱스에서 문자열의 마지막 인덱스까지를 잘라낸 문자열을 반환합니다. 예를 들어 substr('hadoop', 4)는 'oop'를 반환합니다.

substr(string str, int start, int length)

문자열 str의 start 인덱스에서 설정한 length 만큼을 잘라낸 문자열을 반환합니다. 예를 들어 substr('hadoop', 4, 2)라고 하면 'oo'를 반환합니다.

upper(string str)

문자열 str를 대문자로 변환해서 반환합니다. 예를 들어 -upper('hive')는 'HIVE'를 반환합니다.

ucase(string str)

upper 함수와 동일합니다.

lower(string str)

 문자열 str을 소문자로 변환해서 반환합니다. 예를 들어 lower('HIVE')는 'hive'를 반환합니다.

lcase(string str)

Lower 함수와 동일합니다.

trim(string str)

문자열 str의 양쪽에 있는 공백을 제거합니다. 예를 들어 trim(' hive ')는 'hive'를 반환합니다.

ltrim(string str)

문자열 str의 왼쪽에 있는 공백을 제거합니다. 예를 들어 ltrim(' hive ')는 'hive '를 반환합니다.

rtrim(string str)

문자열 str의 오른쪽에 있는 공백을 제거합니다. 예를 들어 rtrim(' hive ')는 ' hive'를 반환합니다.

regexp_replace(string str, string regex, string replacement)

문자열 str에서 정규 표현식 regex와 일치하는 모든 문자열을 replacement로 변경해서 반환합니다. 예를 들어 regexp_replace('hive', 'iv', '')는 'he'를 반환합니다.

from_unixtime(int unixtime)

유닉스 시간 문자열(1970-01-01 00:00:00 UTC)을 현재 시스템의 시간대로 변경해서 반환합니다.

to_date(string timestamp)

타임스탬프 문자열에서 날짜값만 반환합니다. 예를 들어 to_date("2012-09-01 00:00:00")는 "2012-09-01"을 반환합니다.

round(double a)

double 값 a에 대한 반올림 정수값(BIGINT)을 반환합니다.

floor(double a)

double 값 a보다 작거나 같은 최대 정수값(BIGINT)을 반환합니다.

ceil(double a)

double 값 a보다 크거나 같은 최소한의 정수값(BIGINT)을 반환합니다.

rand(), rand(int seed)

랜덤값을 반환합니다. seed 파라미터로 랜덤값의 범위를 설정할 수 있습니다.

year(string date)

날짜 혹은 타임스탬프 문자열에서 년도만 반환합니다. 예를 들어 year("2012-09-01 00:00:00")은 "2012"를 반환합니다.

month(string date)

날짜 혹은 타임스탬프 문자열에서 월만 반환합니다. 예를 들어 month("2012-09-01 00:00:00")은 "09"를 반환합니다.

day(string date)

날짜 혹은 타임스탬프 문자열에서 일만 반환합니다. 예를 들어 day("2012-09-01 00:00:00")은 "01"를 반환합니다.

get_json_object(string json_string, string path)

 디렉터리 path에서 문자열 json_string으로부터 json 객체를 추출하고 json 문자열로 반환합니다. 만약 json이 유효하지 않으면 null 값을 반환합니다.

size(Map<K.V>)

맵 타입의 엘리먼트의 개수를 반환합니다.

size(Array<T>)

배열 타입의 엘리먼트의 개수를 반환합니다.

cast(<expr> as <type>)

정규 표현식 expr을 type으로 타입을 변환합니다. 예를 들어 cast('100' as BIGINT)는 '100'을 BIGINT로 변환해서 반환합니다. 변환에 실패할 경우 null 값을 반환합니다.



* 참고: 시작하세요! 하둡 프로그래밍


+ Recent posts