Modul:Dátumszűrés
A modult a Modul:Dátumszűrés/doc lapon tudod dokumentálni
-- A MODUL FÜGGVÉNYEIT ÉS ADATAIT CSAK require('Modul:Dátumszűrés') MÓDON TUDJUK ELÉRNI.
-- A CitWeb és családja számára készült el.
require('strict')
-- a magyar dátumhoz kell
local honapok = {'jan.', 'feb.', 'márc.', 'ápr.', 'máj.', 'jún.', 'júl.', 'aug.', 'szept.', 'okt.', 'nov.', 'dec.'}
-- ellenőrizzük az egyes hónapok hosszát
local honaphossz = {31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31}
-- pop a nyomkövetés céljait szolgálja
local ou = ''
local function pop(...) -- idézőjeles rész és bővítmények az ou számára
--[[ memóriatúllépést okoz, csak teszteléshez
local list = {...}
for _, var in pairs(list) do
ou = ou .. tostring(var) .. '\n '
mw.log(ou)
end
]]
end
-- a magyar helyesírás szerinti rövidített hónapnevek a honapnevesdate() kimenetének
-- előállításához
-- az ISO 8604 szabvány szerinti dátumban a hónap helyére lépő stringet szolgáltatja
local honapsorszamekezetnelkul = {
['jan'] = '01', -- january, Januar
['feb'] = '02', -- february, Februar, février
['mar'] = '03', -- mars, März, mars
['apr'] = '04', -- april, avril első betű a, második v APRL AVRL
['maj'] = '05', -- may mai mai az első betű m, a harmadik nem r MAY
['jun'] = '06', -- june, juin az első kettő ju de a harmadik i JUN
['jul'] = '07', -- july, juli, juillet viszont itt is i, VEGYÜK KI AZ I-T A NÉVBŐL: JUL
['aug'] = '08', -- august, aout első betű a, második o
['sze'] = '09', -- sept
['okt'] = '10',
['nov'] = '11',
['dec'] = '12'
}
-- a római számmal megadott hónap decimális megfelelője
local decimal = {
['I'] = 1,
['II'] = 2,
['III'] = 3,
['IV'] = 4,
['V'] = 5,
['VI'] = 6,
['VII'] = 7,
['VIII'] = 8,
['IX'] = 9,
['X'] = 10,
['XI'] = 11,
['XII'] = 12
}
local hibavan = false
-- kell a dátum ellenőrzéséhez
-- a numerikus dátumokat kezeli le és ISO 8604 szabvány szerinti dátumot csinál a bemeneti esetleg helytelenül megadott dátumból
--[[
DÁTUMSZŰRŐ:
Kiszűri a bemenetén kapott dátumokból
a) a csupa számból álló ISO 8604 dátumokat
b) a római számmal megadott magyar dátumokat
c) a magyar vagy idegen hónapneveket tartalmazó dátumokat
és ezekből mind helyesen formázott ISO 8604 dátumokat csinál
--]]
local function error(about) -- hibajelzést szolgál
-- Enclose errorMsg with <span>
-- Precondition:
-- about -- string
hibavan = true
local r = about
if type(about) == 'string' then
if #about == 0 then
r = 'Lua-hiba'
end
else
r = tostring(about)
end
return '<span class="error">' .. r .. '</span>, '
end -- error()
local function isRoman(v)
if type(v) ~= 'string' then
-- A római számok stringek
return false
end
if v:find('[^IVXLCDM]') then
return false
end
end
--[[ month_to_hu(m)
segéd-funkció, mely az idegen hónapneveket helyettesíti az ékezet nélküli, három karakteres rövidített
magyar hónapnevekre (a rövidítést nem jelzi ponttal)
Ennek alapján beküzdi a kétjegyű hónap-sorszámot az ISO 8604 szabványnak megfelelő alakban
--]]
local function month_to_hu(m)
--[[
Spanyol: enero febrero marzo abril mayo junio julio ago septiembre v. setiembre octubre noviembre diziembre
Portugál: janeiro fevereiro marco abril maio junho julho agosto setembro outubro novembro dezembro
Olasz: gennaio febbraio marzo aprile maggio giugno luglio agosto settembre ottobre novemre dicembre
--]]
local alfa, eb, ub, e2b
if not m then
return
end
m = string.gsub(m, ' ', '') -- cseréljük fel a szóközöket üressel
m = string.gsub(m, 'ä', 'a') -- März, mars problem ôû
m = string.gsub(m, 'û', 'u')
m = string.lower(m) -- minden kisbetűs
alfa = string.match(m, '[a-z%-]+') -- kötőjel problémás
if alfa then -- vannak egyáltalán betűk
pop('1- alfa=', alfa)
m = string.sub(m, 1, 3) --három betünk van
eb = string.sub(m, 1, 1)
if eb == 'm' then
ub = string.sub(m, -1, -1)
if ub == 'i' then m = 'maj'
elseif ub == 'r' then m = 'mar'
elseif ub == 'y' then m = 'maj'
elseif ub == 'g' then m = 'maj' --maggio
end
elseif eb == 'e' then
m = 'jan' --spanyol
elseif eb == 'g' then
e2b = string.sub(m, 1, 2)
if e2b == 'ge' then
m = 'jan'
elseif e2b == 'gi' then
m = 'jun' --- olasz
end
elseif eb == 'j' then
if string.sub(m, 2, 2) == 'a' then
m = 'jan'
elseif string.sub(m, 3, 3) == 'n' then
m = 'jun'
elseif string.sub(m, 3, 3) == 'i' then
m = 'jul'
end
elseif eb == 'a' then
if m:find('^a[pvb]') then
m = 'apr'
elseif m:find('^a[ugo]') then
m = 'aug'
end
elseif eb == 'f' then m = 'feb'
elseif eb == 'l' then m = 'jul' --olasz
elseif eb == 's' then m = 'sze'
elseif eb == 'o' then m = 'okt'
elseif eb == 'n' then m = 'nov'
elseif eb == 'd' then m = 'dec'
else
return false
end
else
return false
end
return m
end
local function szokoev(ev)
if ev == nil then
return false
end
local e = tonumber(ev)
if e then -- is numeric?
if e % 400 == 0 then return true end
if e % 100 == 0 then return false end
if e % 4 == 0 then return true end
end
return false
end
--[[ en_to_hu(de)
Angol vagy amerikai angol dátumokból, illetve német, francia, olasz, spanyol
és portugál dátumokból csinál ISO 8604 szabvány szerinti dátumot. Esetleg
bővíthető ez a lista, ha nem vezet kollízióra az idegen neveket értelmező
en_to_hu funkcióban. Hibás dátum esetén false értékkel tér vissza.
--]]
local function en_to_hu(de)
pop('en_to_hu indul')
--Az angol dátumokat jó lenne felismernie: "Dec. 10, 2013". string.lower(s)
local ev, ho, nap, maradek
if type(de) ~= 'string' then
return false
end
de = string.gsub(de, ' ', '') -- cseréljük fel a szóközöket üressel
de = string.gsub(de, '[%.%-]', '/')-- cseréljük fel a pontot és kötőjelet perjellel dec/10/2013
--éôûäde = string.gsub(de, 'é', 'e')--éôûäF
de = string.lower(de) -- minden kisbetűs
ev = string.match(de, '%d%d%d%d?')-- keress a dátumban az évet 2013
if ev then
maradek = string.gsub(de, ev, '')
else
return false
end
if maradek then
pop('en maradek?', maradek)
-- számmal indul mert little endian
maradek = string.gsub(maradek, '/', '') -- már nincsenek perjelek dec10, vagy pl dec
local i, j
i, j = string.match(maradek, '()%d%d?()')
pop('nap indexei a maradékban=', i, j)
if j then
nap = string.sub(maradek, i, j-1)
end
pop('nap ?= ', nap)
if nap then
ho = string.gsub(maradek, nap, '')
else
ho = maradek
end -- azaz dec10 esetén marad dec, dec esetén pedig ő a hónap
end
de = ev
ho = honapsorszamekezetnelkul[month_to_hu(ho)]
if ho then
de = de .. '-' .. ho
end
if nap then
de = de .. '-' .. nap
end -- összeraktuk a dátumot
pop('USA&en átalakult?', de)
local honum = tonumber(ho)
pop('honum', honum)
if honum == nil or 1 > honum or honum > 12 then
return false -- hónap sorszáma hibás
end
pop('nap=', nap)
pop('nap típusa: ', type(nap))
if nap then
local napnum = tonumber(nap)
pop('napnum', napnum)
if napnum ~= nil and 1 <= napnum and napnum <= 31 then
pop('napnum jó?g', napnum)
if szokoev(ev) then
honaphossz[2] = 29
else
honaphossz[2] = 28
end
if honaphossz[honum] < napnum then
return false
end -- nap sorszáma hibás
else
return false
end -- nap sorszáma hibás
end
return de
end
local function ekezet_le(s)
s = string.gsub(s, 'á', 'a')
s = string.gsub(s, 'é', 'e')
s = string.gsub(s, 'í', 'i')
s = string.gsub(s, 'ó', 'o')
s = string.gsub(s, 'ő', 'ö')
s = string.gsub(s, 'ú', 'u')
s = string.gsub(s, 'ű', 'ö')
s = string.gsub(s, 'ä', 'a')
s = string.gsub(s, 'ô', 'o')
s = string.gsub(s, 'û', 'u')
return s
end
local function numdate(de)
local ev, ho, nap, i, j, maradek
local de, perek = string.gsub(de, '%-', '/')
pop('numdate de perekkel = ', de, tostring(perek))
if perek == 2 then
i, j = string.find(de, '/')
pop('numdate_2peres, benne hol a perjel = ', i, j)
ev = string.sub(de, 1, j-1)
maradek = string.sub(de, j+1, -1)
pop('numdate_2peres: év, maradek = ' .. ev .. ', ' .. maradek)
i, j = string.find(maradek, '/')
pop('numdate_2peres i,j a hóhoz és naphoz = ', i, j)
ho = string.sub(maradek, 1, j-1)
nap = string.sub(maradek, j+1, -1)
pop('2peres év, maradekban ho, nap = ', ho, nap)
elseif perek == 1 then -- van év és hó
i, j = string.find(de, '/')
pop('numdate_1peres, benne hol a perjel = ', i, j)
ev = string.sub(de, 1, j-1)
ho = string.sub(de, j+1, -1)
pop('numdate_1peres: év, hó = ', ev, ho)
else
ev = de
end
if #ev < 3 then
return false
end
pop('év hossza=', tostring(#ev))
if ho then
local honum = tonumber(ho)
pop('ho számmal=', tostring(honum))
if honum then
if 1 > honum or honum > 12 then
-- hónap sorszáma hibás
return false
end
if nap then
local napnum = tonumber(nap)
pop('nap számmal=', tostring(napnum))
if not (napnum and 1 <= napnum and napnum <= 31) then
return false
end
if szokoev(ev) then
honaphossz[2] = 29
else
honaphossz[2] = 28
end
if honaphossz[honum] < napnum then
pop('túl a hónaphatáron a nap')
return false -- nap sorszáma hibás
else
pop('ellenőrzött év, hó, nap', ev, ho, nap)
end
end
end
end
de = ev
if ho and ho ~= '' then
de = de .. '-' .. ho
end
if nap then
de = de .. '-' .. nap
end
pop('numdate átadja:', de)
return de
end
local function hudate(de)
pop('hudate indul')
local i, j, ev, ho, nap, maradek
pop(de)
ev = string.match(de, '^%d%d%d%d?') -- ééé v. éééé levágva ev-be
pop('ev=', ev)
local hostring = string.match(de, '%a+')
if hostring then
ho = string.sub(hostring, 1, 3)
end
pop('ho=', ho)
if ho then
i, j = string.find(de, ho)
maradek = string.gsub(string.sub(de, j+1, -1), '%p', '')
nap = string.match(maradek, '%d%d?')
pop('nap=', nap)
end
if isRoman(ho) then
ho = decimal[ho]
if ho then
-- A római számból decimálist csinál a tábla, ebből ismét string kell,
-- hogy az if utasítás végén mindenképpen string hónapunk legyen
ho = tostring(ho)
else
return false
end
pop('ho rómaiból = ', ho)
else
ho = honapsorszamekezetnelkul[ho]
end
if ho then
local honum = tonumber(ho)
pop('honum=', tostring(honum))
if honum then
if 1 > honum or honum > 12 then
-- A hónap sorszáma hibás
return false
end
if nap then
local napnum = tonumber(nap)
pop('napnum=', tostring(napnum))
if not (napnum and 1 <= napnum and napnum <= 31) then
return false
end
if szokoev(ev) then
honaphossz[2] = 29
else
honaphossz[2] = 28
end
if honaphossz[honum] < napnum then
pop('fals nap')
return false -- nap sorszáma hibás
else
pop('másodszor', ev, ho, nap)
end
end
end
end
if ho~= nil and #ho < 2 then
ho = '0' .. ho
end
de = ev
if ho then
de = de .. '-' .. ho
end
if nap then
de = de .. '-' .. nap
end
return de
end
--[[ datumszuro(de)
megszűri a numerikus éééé-hh-nn, illetve a Dec. 10, 2001, 10 january 2001, 2001. december 10 formákat,
leellenőrzi a dátumot (hónaphossz, létező hónap sorszám)
és valamennyiből az ISO 8604 szabvány szerinti dátumot csinál
--]]
local function datumszuro(de)
local log, cserelt
if not de then
return ou, false
else
de, cserelt = string.gsub(de, '%.', '-')
if cserelt == 2 then
de = string.gsub(de, '%-*$', '')
end -- ha a végén van kötőjel, lecsipjük
end
pop('datumszurodatuma paramétere= ', de)
de = ekezet_le(de)
pop('ékezetek nélküli dátum=', de)
de = string.gsub(de, '%s', '')
local i, j = string.match(de, '()%d%d%d%d?()')
if not j then
return ou, false -- mert nincs év a dátumban
else
-- ha j == 5, akkor a dátum elején áll az év, magyar a dátum vagy ISO
pop(i, j, string.sub(de, i, j-1))
end
if not de or type(de)~= 'string' then
return ou, false
end
local d2 = string.gsub(de, '[%p%-]', '') -- punctuation, kötjel is üres lesz
pop('d2 van benne kötjel?', d2)
d2 = tonumber(d2)
pop('d2 mint szám', d2)
if d2 then
--[[ a dátum számjegyes
adB1) keresünk %d%d%d%d? mintával négy- vagy háromjegyű decimálist a dátumban
ha van, megnézzük, hogy hol van ő a dátreturn 1, false endumban,
ha elől akkor tényleg magyar a dátum (átadjuk a kezelőjének: ennek nagy része már megvan az datumoutput-ban)
különben ad B2) höz
--]]
log = numdate(de)
if log == false then
-- hibás a dátum
return ou, false
end
else
-- betűk is vannak d2-ben
local i, j = string.match(de, '()%d%d%d%d?()')
if j == 5 then
log = hudate(de)-- mert magyar a dátum
pop('hudate utáni dátum= ', log)-- meghívjuk a magyar dátum lekezelését log vagy false, vagy a magyar dátum
else
log = en_to_hu(de)
pop('en_to_hu utáni dátum= ', log)
end
end
if log == false then
-- hibás a dátum
return ou, false
end
pop('dátum a dátumszűrés végén = ', log)
return ou, log -- azaz a dátum
end
local function honapnevesdate(isodate)
local ev, ho, nap, i, j, maradek, de
if not isodate then
return
end
isodate = string.gsub(isodate, '%s+', '')
i, j = string.find(isodate, '-')
if i then
ev, maradek = string.match(isodate, '(%d+)%s*%-%s*([%d%p%-]+)') --, ho, nap --%-%s*(%d+)%s*%s*(%d+)%s"
pop('isodate ev,maradek=', ev, maradek)
i, j = string.find(maradek, '-')
if i then
ho, nap = string.match(maradek, '(%d+)%s*%-%s*([%d%p%-]+)')
pop('isodate ho, nap = ', tostring(ho), nap)
else
ho = maradek
end
ho = honapok[tonumber(ho)]
else
ev = isodate
end
de = ev
if ho then
de = de .. '. ' .. ho
end
if nap then
de = de .. ' ' .. tonumber(nap) .. '.'
end
return de
end
-- csak a dátumszűrés és a honapnevesdate publikus a modulból
local q = {
datumszuro = datumszuro,
honapnevesdate = honapnevesdate
}
return q